投稿連結:https://forms.gle/5jCeHP6FzapfcReq8
截止日期:2020-06-12 (五) 11:30 AM
想知道目前有哪些講題嗎?需要一點靈感?
請上 https://github.com/datacon2020/proposal/issues
看看其他講者是怎麼寫摘要的呢?
今年比較有趣的是「資料科學」與「人工智慧」相關的投稿比往年多~
其次,目前還沒有投稿 #維運者#Administrator 耶~
有人要貢獻一些真實維運的辛酸血淚嗎?
這裡貢獻一些靈感:
- <#Sizing> Big Data on the Cloud 的年代,您是怎麼決定該開多大組的 AWS EMR, GCP DataProc, Azure HDInsight 呢?
- <#Hardware Spec> 想入門 Deep Learning,該選怎樣的顯示卡/加速器與配套的硬體來做加速呢?電源供給有沒有什麼雷呢?怕跑到一半熱當,該怎麼強化冷卻系統?
- <#Benchmark> 為什麼貴組織挑 GCP BigQuery 而不是 AWS Redshift 呢?有人實測過 Impala 搭配 Kudu, 或其他 File Format (Parquet, Avro, ORC, etc) 的效能差異嗎?實務上,挑選什麼樣的壓縮演算法呢?有人願意出來分享一下使用 Spark XML 跟直接用 Scala XML 的效能差異嗎?
- <#Authentication> 怎麼設計支援 High Scalibility 的 Sigle-Sign On Authentication 架構呢?
- <#Security> 您的組織是否有導入 Kerberos, 整合 Active Directory 或 LDAP 系統呢?貴組織是如何確保 Data Access 的 Security Policy 呢?你們導入了 Sentry 還是 Ranger 呢?你知道 Sentry 後來的發展怎麼了嗎?Ranger 到底什麼時候才要支援 Spark SQL 呢?有人知道怎麼讓 Ranger 也支援 MySQL / AWS RDS 嗎?
- <#TCO> Big Data on the Cloud 年代,貴組織有計算過為了達成商業目標,背後付出的 Data Platform 總擁有成本是多少嗎?架構上有可以優化省錢的小撇步嗎?
- <#Troubleshooting> 不管是自建 Data Platform 還是使用雲環境,總是難免遇到開發團隊提出的問題,您是怎麼因應的呢?發 Support Ticket 給雲服務?找第三方技術專業團隊支援?身為開發者,遇到 Spark OutOfMemory Error,您會怎麼追蹤問題的根源呢?用 Profile 工具?Flame Graph?有沒有什麼好用的 APM 平台可以幫忙優化商轉中的 Data Pipeline 呢?
上面零零總總列了一堆問句,某幾個問題是我這幾年工作上身邊的夥伴真實解掉的問題,當然我會去推坑看看他們願不願意出來講。如果您覺得某些問題剛好打中你們組織現在遇到的痛點,歡迎留言讓我知道,我會更用力去推坑看看的~
最後,投稿當講者有什麼好處呢?
– 聲望+:打響您在臺灣資料工程界的名氣,讓更多人認識您
– 好康+:免收臺灣資料工程協會入會費與 2021 年常年會費
– 知識+:不必跟別人搶年會門票,還能走講者快速通關通道
– 薪情+:小聲說~往年上台的講者都蠻容易被高薪挖角~哈
別再猶豫了~趕快投稿吧!!
– Jazz Yao-Tsung Wang
糾結於實體與虛擬的疲累年會總召