2020年8月29日 星期六

20200829 AIOT 分享會(打造AI團隊)




AIWin公司創辦人經驗分享
AI來自DATA但也要了解Domain

領域
高爾夫球、紡織

成果
概念驗證30+ Domain10+ 落地5+

產業AI化服務
顧問服務、演算法、AI訓練、AI推論、系統整合、客製化服務

可複製的Domain Knowledge
產業Domain:生產流程、瑕疵定義、機械結構、打光取像技巧
存活下來原因: Domain

幾個第一
高爾夫球(提高良率、每天10萬顆)、TSMC半導體代工廠(公安相關影像辨識、巡檢機器人每半小時)、南部鋼鐵廠(鋼捲噴印噴寫字跡,鋼鐵在捲的過程字會變形透過AI解決、每3小時一捲)

關於類神經網路的看法
透過大數據找規律做預測,沒有接觸到學理課程者無法理解,產業現場充滿許多錯誤認知
值得關注技術AutoML(避免人工誤判)、AIchip(加速落地)

對AI的看法(期待與落差)
去年大陸倒了2800家AI新創(還沒把對手幹掉,技術卻迫使這些新創退場),但也多了1萬多家公司

台灣AI調查
實際阻擋企業推動AI原因(64%是資料、36%是經營者)

AI期待與實際
2014-2016發現
2017高度期待與嘗試
2018實際落地
2019落差產生認知真實

客戶問題
AI人才不足、AI基礎建設不足、AI投資金額過高、資料不足、Domain數位化不足、AI認知與信心不足

客戶對AI產品認知落差
以為在買office、沒有Data的概念

導入AI六面向(AI與Domain的鴻溝)
領導/PM=>系統整合PM=>資料科學家=>(AI系統架構(AI系統設計師、AI訓練師)、Domian專家(資料標記審核員、資料量化科學家))做AI過程也學到domain,需要反覆溝通(這是跨部門協作工作)

1.團隊與協作人才
量化是第一步,團隊相關人員都須具備AI觀念

2.問題探詢與定義


2.資料的質與量
資料的質>量,質有兩的面(技術面與業務面)
如資料存在人為偏見須更大量將偏見中性化
人無法很明確定義資料也難明確定義須更大量取得中性化
資料挖掘搜索需要持續永恆才能挖掘出資料的全貌\


3.演算法的挑選與資料質量
需理解演算法

4.軟硬體基礎佈建
AI軟體佈建 Tensor 
資料系統管理佈建

專案短中長期目標
專案常止於POC(目標定義太高、目的與業務、...)
AI專案是資料相依且高度迭代
短期(產生從0到1、準確率70%-80%),中期(準確度80%-90%,有策略地蒐集資料),長期(建立資料管理系統,準確率90%-99%)

導入AI容易被忽略的細節
需要跨部門整合、IT部門只是一部分
專案誕生的資料是公司重要資產需要專門管理
需要有策略性取得資料
資料價值須被判斷
AI技術年年更新需要保持更新速度

別忽略資料維運的重要

實例分享 POC
門禁人臉辨識、面板組裝廠組裝線影像辨識(與日本ADI合作)(未來可以在edge computing)(操作人員所鎖螺絲用camera算稼動率)、門把組裝廠、彰化鞋帶紡織辨識、金屬元件辨識、高爾夫球頭(大陸特別找20歲女生新鮮的眼睛)、面板蝕刻狀態、日月光晶圓接點、塑料瑕疵檢測、電子菸(菸頭)瑕疵檢測、門把瑕疵檢測、

問題
提完proposal 技術評比不錯,但最後業主拿這個proposal然後自己做、PCB軟板

QA
  • 驗收問題:是每一家做AI公司的難點(因為資料多寡才符合客戶需要這是雞生蛋蛋生雞的問題)因此要溝通(我們在創造一個沒有人做過的問題,把客人最高目標列上去,做到一個目標在deal一個可接受可驗收目標)(當然他也會用各種理由因此透過業務溝通)樣本多寡取決於資料品質
  • 現在做AI面臨的問題:要思考如何用小樣本解決大問題,現在大家都是大資料解決小智慧小問題)
  • 遷移學習:(要先在domain有累積夠多資料) GAN(要生成對抗要先有資料以及解決資料擴增問題)
  • 人類贏過MACHIN LEARNING的地方:就是人類了解因果與功能性(例如大家看到手機會知道手機,但問20年的人會說那是螢幕吧)(因此是由功能性推動知道他是什模東西)(因果:瑕疵是透過甚麼製程產生)這些都要透過學習
  • 訓練: 拿8成資料訓練2成資料驗證甚至拿一部分資料做考題
  • 推動AI成功因素:信念
  • 如果可以開始會從哪開始? 還是瑕疵檢測
  • 高爾夫球以前是人全檢,現在透過AI節省了3成到5成的工時
  • 時序上資料RNN可以解決,但有些因果關係是製程與製程的關係
  • segmentation的資料整理比object dection還困難因此實務上有所取捨
  • 資料擴增(翻轉、加noise、從一張變幾十張)我們都會做,但現在我們做的擴增是(用數位方式模擬出相像資料讓模擬的瑕疵與真實瑕疵相像,另一個方式是透過GAN),做紡織時發現紡織有固定pattern
  • 以高爾夫球為例一開始花了2年與業主建立共識與驗收標準(如何檢測、哪種是對哪種是錯先把定義定出來)
  • POC流程(先解決取資料問題、資料定義、如何取SAMPLE與Training)(台灣會給POC前的只有護國神山因此要思考公司內部資源是否可以做這件事)
  • 以高爾夫球檢測為例(環境會影響檢測例如灰塵)(設備過殺與誤殺取捨問題,要與客戶討論錯殺的取捨,例如環境問題)
  • 目前瑕疵檢測使用模式用有線是否有機會用無線(客人要求不但要準還要快,因此走有線且隔離線,在OT端放運算主機,分析完才拋到雲端)
  • OT端主機算力規格(取決到一開始評估本案的解析度)(一張P40要20幾萬、有些縮小到一秒一張,看應用,工廠端主機過去不歡迎GPU,不只是為了省電還擔心發熱)