近年來,有大量的業學界學者專家投入大數據相關技術,根據Hadoop Summit 2015、CSDN 2014大數據技術大會等國外指標性論壇所討論的主軸,In-Memory技術已成為近期最熱門的大數據技術,而最為人熟知的是由加州柏克萊大學所發展的 BDAS ( Berkeley Data Analytics Stack ),其中從儲存、運算、資料檢索都利用了In-Memory 技術,提供優於MapReduce運算框架 10~100倍的效能。
隨著交友社群Facebook、電子論壇與媒體發達及智慧型手機的興起,人們交換訊息的方式大多從傳統的對話書寫,進而轉向透過手機或電腦進行電子訊息互動。而這些訊息資訊包羅萬象,量級也都很大,在各個領域都含有很大的潛在資訊與商機。
為了協助國內業界獲取並藉由開源大數據流處理平台(Hortonworks)處理這些訊息,資展國際特規畫「網路爬蟲與Spark大數據流處理實務」課程,本課程將由琢磨於資料的生、流、存、算環節,透過OpenSource進行網路資料擷取,進而如何使用大數據流處理技術(Kafka與Spark Streaming)來結構化與處理所取得的資料流。本課程將以實機實戰的方式,讓每位學員都能自行撰寫相關程式,並可在過程中了解各種可能面臨的狀況,增進學習效果,激盪出許多解決方案!
本課程教導學員能透過開源Library從網站、社群媒體、裝置獲取資訊,並能將非結構化資料轉換為結構化資料,交由Kafka訊息管理系統做統一管理,接著利用Spark Streaming進行大數據流的即時運算,並將結果予以應用。課程設計能使學員親身體驗資料串流的處理,並能從體驗中遭遇的問題,學習更多解決方案,加倍學習之效果。
本課程旨在建立即時串流資料處理系統,教導學員如何撰寫一網路爬蟲,以便於網站、社群API中獲取資料,並將接收到的非結構資料,快速透過工具進行結構化解析。解析後的資料如何介接到訊息處理叢集Kafka,最後利用Spark Streaming進行大數據流處理與應用。讓參訓學員瞭解正確的觀念與方法,課程重點在於透過採體驗式教學方式的實作,學員能夠學習如何透過開源工具Hortonworks快速搭建大數據流分析叢集,並能在平台上實際演練大數據操作與分析,以從體驗中驗證課程所學。課程會以Spark核心技術,與串流處理技術Spark Streaming 結合第三方串流平台(Kafka、Socket等)為課程主軸,學員可以學習到如何即時處理大量串流資料,並透過Spark相關核心工具與機器學習技術加以分析出結果,讓資料會說話!
9:00-17:00,14小時,共兩天
課程單元 | 課程內容 | 時數 |
---|---|---|
課程環境準備 | · 課程VM環境準備與設定 | 14 |
資料流獲取 | · 網頁爬蟲實戰技術 · 網頁結構化解析技術 · 社群媒體資料擷取技術(Facebook、Ptt、Mobile01等實作) · Socket 資料流獲取技術 ( 網路層基礎Socket Server實作) | |
Spark 技術回顧 | · Spark Batch處理技術 | |
Kafka與Spark Streaming技術實作 | · Spark Streaming DStream 方法介紹與實作 · Kafka 訊息管理系統介紹與實作 · Spark Streaming資料流與Kafka介接技術 | |
綜合實戰練習 | · 開源中文斷詞Library使用 · PTT八卦版即時關鍵字訊息流獲取系統實作 |
*課程執行單位保留調整課程內容、日程與講師之權利
A.至少需達10人才予開課,本公司最晚於上課前一週通知是否開課。
※主辦單位得視報名情況而保留實際開課日期的變更權利
A.資展國際股份有限公司
台北 : 台北市復興南路一段390號2、3樓
桃園 : 桃園市中壢區新生路二段421號 (聖德基督學院)
台中 : 台中市南屯區公益路二段51號18樓
高雄 : 高雄市中正四路211號8樓之1
※上課地點與教室之確認,以上課通知函為主
A.本課程採線上報名,請至課程頁面報名。
※客服專線 : (02) 6631-6588、(02) 6631-6581
A.報名課程之學員將於開課前7天內收到e-mail通知,確認課程是否開課,確認開課才需繳費。
※政府計畫學費補助方案班級,則悉依計畫規定辦理
A.匯款方式可選擇信用卡、ATM匯款。
- 以信用卡支付者 : 確定開班後會寄發訂單連結,請於指定繳費期限內完成線上刷卡
- 以ATM匯款支付者 : 確定開班後會寄發繳費帳號,請於指定繳費期限內完成繳費
※課程若未如期開班,費用將全額退還
A.
1)團報優惠 : 2-3人團報可打95折、4人(以上)團報可打9折優惠 (團報優惠與早鳥優惠可一併使用)
2)每門課程會有早鳥報名優惠期限
※線上課程報名每個帳號僅提供一位學員報名,若為團報學員,每位皆必須完成線上報名,並於其他金額說明欄位註記「與XXX一起團報」,以利事後核對名單
※政府計畫學費補助方案班級,則悉依計畫規定辦理
A.
1)已完成報名與繳費之學員,課程主辦單位將於開課三天前以E-mail方式寄發上課通知函;若課程因故取消或延期,亦將以E-mail方式通知,如未收到任何通知 ,敬請來電確認。
2)已完成繳費之學員如欲取消報名,請於實際上課日前以信件通知業務承辦人,主辦單位將退還90% 課程費用。
3)學員於培訓期間如因個人因素無法繼續參與課程,將依課程退費規定辦理之︰上課未逾總時數三分之一,欲辦理退費,可退還所有費用二分之一;上課逾總時數三分之一,則不退費。
4)課程執行單位保留是否接受報名之權利。
5)如遇不可抗拒之因素,課程主辦單位保留修訂課程日期及取消課程的權利。
6)政府計畫學費補助方案班級,則悉依計畫規定辦理。
A.依資展國際股份有限公司ISO品質系統之「教育訓練服務程序」規定,本課程為短期班,參訓學員缺課未超過總時數五分之一者,結業時由本公司核發結業證書。
A.本課程上課期間,每天都會提供午餐,學員不需自行準備或額外付費。