【111-1產業人才投資課程】RPA機器人網路爬蟲與資料處理實務班

RPA機器人網路爬蟲與資料處理實務班

◆課程目標◆
具備資料分析能力
具備網站資料爬蟲能力
具備內化數據分析能力
具備動、靜態網路爬蟲能力
具備獨立開發各媒體爬蟲手法

 

◆課程內容◆
HTML、JSON 與網路爬蟲的基礎
1. HTML與架構說明;2. JSON語法;3.網路爬蟲介紹與相關技術。

從網路取得資料
1.HTTP與Request要求;2.檔案存檔與讀取。

擷取靜態 HTML 網頁資料
1.BeautifulSoup物件建立;2.BeautifulSoup分析工具;3.正規表達式操作。

使用 CSS 選擇器爬取資料
1.定位CSS標籤;2.在BeautifulSoup使用CSS選擇器。

靜態網頁應用案例
股市資訊分析

使用 XPath 運算式與 lxml 套件建立爬蟲程式
1.XPath與lxml套件;2.XPath資料模型;3.XPath基本語法;4.XPath Helper工具。

Selenium 表單互動與動態網頁擷取
1.動態網頁基礎;2.Selenium的基本使用;3.定位網頁資料;4.與HTML進行互動。

動態網頁分析應用案例
1.購屋網網站資料分析;2.拍賣網站動態資料截取。

Scrapy爬蟲框架
1.Scrapy爬蟲框架;2.使用Scrapy Shell;3.輸出Scrapy爬取的資料

Scrapy 爬蟲程式案例-PTT網站及格言網站

使用 Pandas 掌握資料分析
1.DataFrame的基本使用;2.選取、過濾與排序資料;3.Pandas資料清理與轉換;4.分析結果輸出檔案

學員案例實作教學

 

◆報名資訊◆
報名日期:即日起可先預報名。
報名費用:
學員自付1,206元;政府補助4,824元(原價 6,030 元)
報名人數:20
預報名網址https://lihi1.com/unVXL

 

◆課程時間◆
地點:高雄市苓雅區中正二路175號十三樓之3 (台灣文創訓練中心)
日期:111.03.13(日)、111.03.19-111.04.23每週六09:00-17:00,42小時

 

◆資格條件◆
 1.有志進入資料分析領域工作者。
 2.具電腦概論、基礎電腦操作使用、基礎程式編寫(曾接觸過任何一種程式語言均可)
 3.自備筆記型電腦
  (1)電腦硬體規格要求建議(不強制):CPU 採 Core i3 以上,主記憶體 RAM 4GB 以上,硬碟可用空間 50 GB以上,建議自備電源延長線。
  (2)作業系統與軟體規格:本課程範例均以Windows 10為例,建議使用Windows 10筆電(請於課前執行 Windows Update 至最新狀態),使用MAC OS筆電者,將現場解決相關軟體安裝及使用問題。***使用ChromeBook無法相容。

 

◆師資簡介◆
黃煒盛博士 第一科技技術股份有限公司
專長:資訊技術、人工智慧、製程優化、智慧商店

 

◆聯絡方式◆
電話:07-6011758 邱小姐
E-mail:iarc.dojobs@gmail.com