利用统计学,我们可以更深入、更细致地观察数据是如何进行精确组织的,并且基于这种组织结构,如何能够以最佳的形式来应用其它相关的技术以获取更多的信息。今天,我们来看看数据分析师需要掌握的5个基本的统计学概念。
1ãç¹å¾ç»è®¡
ç¹å¾ç»è®¡å¯è½æ¯æ°æ®ç§å¦ä¸æ常ç¨çç»è®¡å¦æ¦å¿µãå®æ¯ä½ å¨ç 究æ°æ®éæ¶ç»å¸¸ä½¿ç¨çç»è®¡ææ¯ï¼å æ¬åå·®ãæ¹å·®ãå¹³åå¼ãä¸ä½æ°ãç¾åæ°ççãç解ç¹å¾ç»è®¡å¹¶ä¸å¨ä»£ç ä¸å®ç°é½æ¯é常容æçã
2ãæ¦çåå¸
æ们å¯ä»¥å°æ¦çå®ä¹ä¸ºä¸äºäºä»¶å°è¦åççå¯è½æ§å¤§å°ï¼ä»¥ç¾åæ°æ¥è¡¨ç¤ºãå¨æ°æ®ç§å¦é¢åä¸ï¼è¿é常被éåå°0å°1çåºé´èå´å ï¼å ¶ä¸0表示äºä»¶ç¡®å®ä¸ä¼åçï¼è1表示äºä»¶ç¡®å®ä¼åçãé£ä¹ï¼æ¦çåå¸å°±æ¯è¡¨ç¤ºææå¯è½å¼åºç°çå ççå½æ°ã
3ãéç»´
éç»´è¿ä¸ªæ¯è¯å¯ä»¥å¾ç´è§çç解ï¼æææ¯éä½ä¸ä¸ªæ°æ®éçç»´æ°ãå¨æ°æ®ç§å¦ä¸ï¼è¿æ¯ç¹å¾åéçæ°éã
4ãè¿éæ ·åæ¬ éæ ·
è¿éæ ·åæ¬ éæ ·æ¯ç¨äºåç±»é®é¢çææ¯ãä¾å¦ï¼æ们æ1ç§åç±»ç2000ä¸ªæ ·æ¬ï¼ä½ç¬¬2ç§åç±»åªæ200ä¸ªæ ·æ¬ãè¿å°æå¼æ们å°è¯å使ç¨ç许å¤æºå¨å¦ä¹ ææ¯æ¥ç»æ°æ®å»ºæ¨¡å¹¶è¿è¡é¢æµãé£ä¹ï¼è¿éæ ·åæ¬ éæ ·å¯ä»¥åºå¯¹è¿ç§æ åµã
5ãè´å¶æ¯ç»è®¡
å®å ¨ç解为ä»ä¹å¨æ们使ç¨è´å¶æ¯ç»è®¡çæ¶åï¼è¦æ±é¦å ç解é¢çç»è®¡å¤±è´¥çå°æ¹ã大å¤æ°äººå¨å¬å°“æ¦ç”è¿ä¸ªè¯çæ¶åï¼é¢çç»è®¡æ¯é¦å æ³å°çç»è®¡ç±»åãå®æ¶ååºç¨ä¸äºæ°å¦ç论æ¥åæäºä»¶åççæ¦çï¼æç¡®å°è¯´ï¼æ们å¯ä¸è®¡ç®çæ°æ®æ¯å éªæ°æ®(prior data)ã
å ³äº5个ç»è®¡åºæ¬æ¦å¿µï¼æ°æ®åæå¸å¿ é¡»äºè§£ï¼éè¤å°ç¼å°±åæ¨å享å°è¿éäºãå¦ææ¨å¯¹å¤§æ°æ®å·¥ç¨ææµåçå ´è¶£ï¼å¸æè¿ç¯æç« å¯ä»¥ä¸ºæ¨æä¾å¸®å©ãå¦ææ¨è¿æ³äºè§£æ´å¤å ³äºæ°æ®åæå¸ã大æ°æ®å·¥ç¨å¸çæå·§åç´ æçå 容ï¼å¯ä»¥ç¹å»æ¬ç«çå ¶ä»æç« è¿è¡å¦ä¹ ã