工程師要訓練AI模型，準備多少學習數據才夠？ | 就愛喝咖啡

因此，如果想知道需要多少訓練數據(TrainingData)，建議先釐清：這個AI專案到底要處理什麼問題，以及這個問題有...(圖片來源：林軒田教授機器學習基石Youtube影片).

所以，訓練AI模型時，團隊如果不知道如何判斷哪個指標，對AI模型學習來說比較重要，建議回歸初心，重新釐清「這個專案想達到的商業目標是什麼」。

比方，趨勢科技 (Trend Micro) 要開發一個能夠判斷電腦病毒的AI，但是勒索病毒 (denial-of-access attack) 和廣告病毒對客戶的傷害程度大不相同。這時候，工程師就會針對這個命題，餵給AI模型不同病毒種類的數據，讓它學會判斷不同病毒的重要性，分辨出哪些病毒比較嚴重不能有判斷錯誤，而哪些病毒比較無害，不一定要做到一百分。

最常見的訓練方法，是用成本函數(Cost Function)的方式，訓練完再回去調整AI模型的評分(Rating)，用加扣分的方式，告訴機器它的學習表現是好是壞，做對就加分，做錯就扣分。

上述評分原則的制定，和企業的商業價值考量息息相關，所以一般在組織分工，會由PM專案團隊負責判斷哪些項目重要，請資料科學家設計在上述Cost Function裡面。

很多人以為，AI人工智慧開發要做到很完美才行，但其實根據我們的經驗，只要AI開發成本符合預算、AI模型表現可接受（大約做到60-70分），而且結果有助於降低成本，就可以算是達到商業目標。反過來，即使AI模型表現非常好（高達90分），但成本卻遠超出預算，就不建議執行。

另外，因為POC階段會做很多的實驗，需要拿兩個穩定且可以互相比較的基準做A/B Test，所以做好基礎建設非常重要。

如果一個團隊裡面有三位工程師，但三個人做出來的結果都無法互相比較，那麼這個實驗就會變得霧裡看花，導致AI專案難以落地。

[Day 27] 機器學習常犯錯的十件事 | 就愛喝咖啡

模型訓練不好的其中一個因素是資料的標籤收集不當。Landing.ai 執行長吳恩達也曾經說過當一個小資料集存在著錯誤標籤時，模型很難給出一個正確的輸出 ... Read More

[Day 3] 機器學習的步驟 | 就愛喝咖啡

[Day 3] 機器學習的步驟 · 收集資料(Gathering data) · 準備數據(Preparing that data) · 選擇模型(Choosing a model) · 訓練機器(Training) · 評估分析(Evaluation) · 調整參數( ... Read More

[Day09] 機器學習的七大步驟 | 就愛喝咖啡

經過特整萃取後，特徵選擇(Feature Selection) 根據機器學習模型學習的結果，去看 ... 若只做一次切分，有些資料會沒有被拿來訓練過，因此就有了cross-validation 的 ... Read More

[Day25]機器學習：特徵與標籤！ | 就愛喝咖啡

利用重量跟表面來當我們訓練的資料，而重量跟表面的資料就是我們所謂的特徵，而標籤就是定義這些特徵的結果是哪一種水果，也就是我們透過機器學習想讓 ... Read More

使用機器學習解決問題的五步驟 | 就愛喝咖啡

2022年1月27日 — 本篇為機器學習入門觀念的第五篇文章。在前一篇文章中，我們介紹了「建立資料集」的概念與重要性。在本篇文章中，將會說明「模型訓練」的意義。 Read More

如何訓練機器學習系統? – Machine Learning 教學系列(三) | 就愛喝咖啡

2021年11月9日 — 在了解 AI、Machine Learning、深度學習的差異以及如何選擇正確且合適的資料後，我們來看看機器學習系統是如何被訓練的吧！ Read More

工程師要訓練AI模型，準備多少學習數據才夠？ | 就愛喝咖啡

因此，如果想知道需要多少訓練數據(Training Data)，建議先釐清：這個AI 專案到底要處理什麼問題，以及這個問題有 ... (圖片來源：林軒田教授機器學習基石Youtube影片). Read More

機器學習怎麼切分資料：訓練、驗證、測試集 | 就愛喝咖啡

2019年12月16日 — 機器學習就像一個學生在學習. 訓練及測試資料. 對於Supervised Learning來說，我們必須使用標註資料(Labeled Data)來做訓練，例如 ... Read More

機器學習的兩個階段：訓練模型和推論資料(training & inference ... | 就愛喝咖啡

機器學習包含兩大階段，訓練模型（建模，traning）和推論資料(使用數據模型，inference/predict) 。後者我在上課時有點不太懂，或許更多人聽過得是測試(test)或是 ... Read More

相關資訊整理

測試資料評價：插座()很多、限時好吃程度 0 顆星

測試資料評價好嗎？這邊幫大家整理位於測試資料的測試資料詳細資訊，像是Wifi、安靜度、甜點、插座及網友評分：店名：測試資...

工程師要訓練AI模型，準備多少學習數據才夠？ | 就愛喝咖啡

[Day 27] 機器學習常犯錯的十件事 | 就愛喝咖啡

[Day 3] 機器學習的步驟 | 就愛喝咖啡

[Day09] 機器學習的七大步驟 | 就愛喝咖啡

[Day25]機器學習：特徵與標籤！ | 就愛喝咖啡

使用機器學習解決問題的五步驟 | 就愛喝咖啡

如何訓練機器學習系統? – Machine Learning 教學系列(三) | 就愛喝咖啡

工程師要訓練AI模型，準備多少學習數據才夠？ | 就愛喝咖啡

機器學習怎麼切分資料：訓練、驗證、測試集 | 就愛喝咖啡

機器學習的兩個階段：訓練模型和推論資料(training & inference ... | 就愛喝咖啡

測試資料評價：插座()很多、限時好吃程度 0 顆星

Cafe' a' la mode評價：插座()很多、限時好吃程度 0 顆星

咖啡烟評價：插座(是)很多、無限時好吃程度 5 顆星

羅曼尼咖啡評價：插座(是)很多、無限時好吃程度 4 顆星

泰比咖啡評價：插座(無)很多、無限時好吃程度 5 顆星

握咖啡Oh！cafe 宜蘭羅東店評價：插座(也許)很多、無限時好吃程度 5 顆星

合日咖啡評價：插座(無)很多、無限時好吃程度 5 顆星

K30 COFFEE評價：插座(無)很多、無限時好吃程度 0 顆星

mumu小客廳評價：插座()很多、限時好吃程度 4 顆星

尚品咖啡 (南門店)評價：插座()很多、無限時好吃程度 5 顆星

好咖 Howcup CURRY CAFE'評價：插座(無)很多、有時候限時好吃程度 4 顆星

Bean There Cafe 自家烘焙館評價：插座(無)很多、無限時好吃程度 3 顆星

義來義去 Eagle Cafe評價：插座(是)很多、無限時好吃程度 4 顆星

月光咖啡廳評價：插座(也許)很多、無限時好吃程度 5 顆星

鐵工廠咖啡評價：插座()很多、限時好吃程度 0 顆星

啡堡創飲-花蓮和平店評價：插座(也許)很多、無限時好吃程度 4 顆星