![Power BI电商数据分析与商业智能(第2版)](https://wfqqreader-1252317822.image.myqcloud.com/cover/86/43738086/b_43738086.jpg)
5.2 动态数据采集
动态数据指采集的目标数据在JS或XHR中,在网页中有特定操作才会向服务器请求加载。
例:批量采集马刺和火箭两支球队的球员在2017年和2018年的比赛数据,以便对比两支球队的球员表现。
根据球队名称、球队名称英文缩写和年份创建球队信息表,如表5-2所示。
表5-2
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_56_1.jpg?sign=1739415888-ZCFGMDzeky1ciI9tqpoTon3Nm3hyrY3h-0-5b5be7adb98b278cd69a13c6005222ff)
在浏览器的开发者模式下,进入NetWork(网络)界面,选择不同年份的赛季,此时NetWork窗口的左侧会新增文件链接,单击新增文件链接,在Preview窗口可查看文件内容,如图5-26所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_56_2.jpg?sign=1739415888-LBYvqOZ3fhtjSa7hZjuCnZy7UCGhwsqF-0-54bc996312962f85758cb3af52c3cf79)
图5-26
数据加载好后,就可以将需要采集的球队数据和年份数据作为参数导入。将表5-2中的数据输入Excel工作表,在Power BI界面的“主页”选项卡中单击“获取数据”下拉按钮,在弹出的下拉列表中选择“Excel”选项,在打开的对话框中选择之前写入表5-2的Excel文件,如图5-27所示,将数据导入Power Query编辑器。
进入Power Query编辑器后,将年份的格式设置为文本,如图5-28所示,便于后续作为参数传入URL中。
创建目标URL,在“添加列”选项卡中单击“自定义列”按钮,弹出“自定义列”对话框,在“自定义列公式”文本框中输入“="http://www.stat-nba.com/team/stat_box_team.php?team="&[缩写]&"&season="&[年份]&"&col=pts&order=1&isseason=1"”,并将新列名设置为“URL”,如图5-29所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_57_1.jpg?sign=1739415888-b0lkJvFsKT8tvwube2EH5vtbKUXdwpEB-0-334782e3eb31cf163b9ed5677dc9842f)
图5-27
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_57_2.jpg?sign=1739415888-8Oh9tts0rivCZPQePMuRkysh4ctH475T-0-86fe5cebbdf38e7a8a92c40c91788aad)
图5-28
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_58_1.jpg?sign=1739415888-I9iLO6eP5ON6wwue2REg88Snc1fuvZt4-0-8cc8adcbdea2237e1f70018af381dbe2)
图5-29
创建好URL后,根据URL下载文件。在“添加列”选项卡中再次单击“自定义列”按钮,弹出“自定义列”对话框,在“自定义列公式”文本框中输入=“Web.Page(Text.FromBinary (Web.Contents([URL]),65001)){0}[Data]”,如图5-30所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_58_2.jpg?sign=1739415888-VI2qJhU4OdEjiI2AAsKNIE04mJVIbbRd-0-8632584e8b7a1d9309a6a821fb36d7e7)
图5-30
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_59_1.jpg?sign=1739415888-O1jLp8T9Rgc22xeVdExgYxhZqSrTM62X-0-3648245f9669ee772c45fd401950894a)
图5-31
Text.FromBinary:将二进制文件转换成文本,其语法结构为Text.FromBinary(binary as nullable binary,optional encoding as nullable number) as nullable text。本例使用该函数是为了解决乱码问题,第二个参数65001表示UTF8编码。
成功下载数据后,展开所有列,可以直接取消勾选空列,并且取消勾选“使用原始列名作为前缀”复选框,如图5-31所示。
展开数据后,取消勾选“总计”“全队数据”“对手数据”复选框,如图5-32所示。
在Power Query编辑器的“主页”选项卡中,单击“关闭并应用”按钮。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_60_1.jpg?sign=1739415888-VHJmw4AL7cfrnjf3scJbFR2aUU6uwjxG-0-69b246a873d7977f648a9260369546ce)
图5-32
加载好的球员数据如图5-33所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_60_2.jpg?sign=1739415888-GdWgJYPsIoirJVKKlCx5ZVFmvKcjJK1t-0-de8b3bc7c153fdeefad7dd6dc90fe210)
图5-33