課程介紹

~歡迎企業洽談包班需求 ~
大數據/人工智慧」 同步招生中 !!

 

一、課程緣起:

近年來,有大量的業學界學者專家投入大數據相關技術,根據Hadoop Summit 2015、CSDN 2014大數據技術大會等國外指標性論壇所討論的主軸,In-Memory技術已成為近期最熱門的大數據技術,而最為人熟知的是由加州柏克萊大學所發展的 BDAS ( Berkeley Data Analytics Stack ),其中從儲存、運算、資料檢索都利用了In-Memory 技術,提供優於MapReduce運算框架 10~100倍的效能。

隨著交友社群Facebook、電子論壇與媒體發達及智慧型手機的興起,人們交換訊息的方式大多從傳統的對話書寫,進而轉向透過手機或電腦進行電子訊息互動。而這些訊息資訊包羅萬象,量級也都很大,在各個領域都含有很大的潛在資訊與商機。

為了協助國內業界獲取並藉由開源大數據流處理平台(Hortonworks)處理這些訊息,資展國際特規畫「網路爬蟲與Spark大數據流處理實務」課程,本課程將由琢磨於資料的生、流、存、算環節,透過OpenSource進行網路資料擷取,進而如何使用大數據流處理技術(Kafka與Spark Streaming)來結構化與處理所取得的資料流。本課程將以實機實戰的方式,讓每位學員都能自行撰寫相關程式,並可在過程中了解各種可能面臨的狀況,增進學習效果,激盪出許多解決方案!

二、課程目標:

本課程教導學員能透過開源Library從網站、社群媒體、裝置獲取資訊,並能將非結構化資料轉換為結構化資料,交由Kafka訊息管理系統做統一管理,接著利用Spark Streaming進行大數據流的即時運算,並將結果予以應用。課程設計能使學員親身體驗資料串流的處理,並能從體驗中遭遇的問題,學習更多解決方案,加倍學習之效果。

三、課程特色:

本課程旨在建立即時串流資料處理系統,教導學員如何撰寫一網路爬蟲,以便於網站、社群API中獲取資料,並將接收到的非結構資料,快速透過工具進行結構化解析。解析後的資料如何介接到訊息處理叢集Kafka,最後利用Spark Streaming進行大數據流處理與應用。讓參訓學員瞭解正確的觀念與方法,課程重點在於透過採體驗式教學方式的實作,學員能夠學習如何透過開源工具Hortonworks快速搭建大數據流分析叢集,並能在平台上實際演練大數據操作與分析,以從體驗中驗證課程所學。課程會以Spark核心技術,與串流處理技術Spark Streaming 結合第三方串流平台(Kafka、Socket等)為課程主軸,學員可以學習到如何即時處理大量串流資料,並透過Spark相關核心工具與機器學習技術加以分析出結果,讓資料會說話!

四、適合對象:

  • 對於雲端運算之大量資料處理、分析、應用有興趣者
  • 資料科學家、資料工程師
  • IT經理或系統網路部門主管
  • 專案經理、系統架構師或系統網路管理人員
  • 企業或技術決策人員

五、上課時間:

9:00-17:00,14小時,共兩天

六、課程大綱:

課程單元課程內容時數
課程環境準備·         課程VM環境準備與設定14
資料流獲取·         網頁爬蟲實戰技術
·         網頁結構化解析技術
·         社群媒體資料擷取技術(Facebook、Ptt、Mobile01等實作)
·         Socket 資料流獲取技術 ( 網路層基礎Socket Server實作)
Spark 技術回顧·         Spark Batch處理技術
Kafka與Spark Streaming技術實作·         Spark Streaming DStream 方法介紹與實作
·         Kafka 訊息管理系統介紹與實作
·         Spark Streaming資料流與Kafka介接技術
綜合實戰練習·         開源中文斷詞Library使用
·         PTT八卦版即時關鍵字訊息流獲取系統實作

*課程執行單位保留調整課程內容、日程與講師之權利

報名課程資訊

  • 本課程採線上報名,報名課程之學員將於開課前7~10天內收到e-mail通知,確認課程是否開課,若確認開課才需繳費
  • 服務時間:上班日09:00 至 17:30
    尚無開課

常見問題

你可能想知道的問題
  • A.至少需達10人才予開課,本公司最晚於上課前一週通知是否開課。
    ※主辦單位得視報名情況而保留實際開課日期的變更權利

  • A.資展國際股份有限公司
    台北 : 台北市復興南路一段390號2、3樓
    桃園 : 桃園市中壢區新生路二段421號 (聖德基督學院)
    台中 : 台中市南屯區公益路二段51號18樓
    高雄 : 高雄市中正四路211號8樓之1
    ※上課地點與教室之確認,以上課通知函為主

  • A.本課程採線上報名,請至課程頁面報名。
    ※客服專線 : (02) 6631-6588、(02) 6631-6581

  • A.報名課程之學員將於開課前7天內收到e-mail通知,確認課程是否開課,確認開課才需繳費。
    ※政府計畫學費補助方案班級,則悉依計畫規定辦理

  • A.匯款方式可選擇信用卡、ATM匯款。
    - 以信用卡支付者 : 確定開班後會寄發訂單連結,請於指定繳費期限內完成線上刷卡
    - 以ATM匯款支付者 : 確定開班後會寄發繳費帳號,請於指定繳費期限內完成繳費
    ※課程若未如期開班,費用將全額退還

  • A.
    1)團報優惠 : 2-3人團報可打95折、4人(以上)團報可打9折優惠 (團報優惠與早鳥優惠可一併使用)
    2)每門課程會有早鳥報名優惠期限
    ※線上課程報名每個帳號僅提供一位學員報名,若為團報學員,每位皆必須完成線上報名,並於其他金額說明欄位註記「與XXX一起團報」,以利事後核對名單
    ※政府計畫學費補助方案班級,則悉依計畫規定辦理

  • A.
    1)已完成報名與繳費之學員,課程主辦單位將於開課三天前以E-mail方式寄發上課通知函;若課程因故取消或延期,亦將以E-mail方式通知,如未收到任何通知 ,敬請來電確認。
    2)已完成繳費之學員如欲取消報名,請於實際上課日前以信件通知業務承辦人,主辦單位將退還90% 課程費用。
    3)學員於培訓期間如因個人因素無法繼續參與課程,將依課程退費規定辦理之︰上課未逾總時數三分之一,欲辦理退費,可退還所有費用二分之一;上課逾總時數三分之一,則不退費。
    4)課程執行單位保留是否接受報名之權利。
    5)如遇不可抗拒之因素,課程主辦單位保留修訂課程日期及取消課程的權利。
    6)政府計畫學費補助方案班級,則悉依計畫規定辦理。

  • A.依資展國際股份有限公司ISO品質系統之「教育訓練服務程序」規定,本課程為短期班,參訓學員缺課未超過總時數五分之一者,結業時由本公司核發結業證書。

  • A.本課程上課期間,每天都會提供午餐,學員不需自行準備或額外付費。

    尚無開課