《TechCrunch》報導,近年印度線上外送市場快速成長,矽谷新創 Human Archive 在這波趨勢下,開始與相關企業合作,蒐集 AI 機器人訓練資料。公司讓工作人員配戴裝有攝影機的頭戴設備,以第一人稱視角記錄日常工作內容,例如打掃、送餐、整理環境等,再將這些真實工作畫面提供給 AI 與機器人公司作為訓練素材,已與居家服務、飯店及餐飲產業合作,並在多個地點部署超過 1,000 組設備。
從外送員到清潔工:用真實工作影像訓練 AI 機器人
Human Archive 日前宣布完成 820 萬美元募資,投資方包括 Wing Venture Capital、NVP Capital、Y Combinator,以及來自 OpenAI、Nvidia、Google、Meta 等科技巨頭。《TechCrunch》提及,公司由加州大學柏克萊分校與史丹佛大學學生共同創立,創辦團隊具備機器人、硬體與觸覺感測研究背景。
Human Archive 說明,AI 與機器人產業面臨的問題,是缺乏足夠的真實世界訓練資料。當各大 AI 公司與機器人實驗室都在開發能執行現實工作的機器時,市場卻缺少大量、真實且高品質的人類工作數據。因此,公司把印度快速成長的零工經濟視為重要資料來源,希望透過外送員、清潔人員等工作者的日常工作過程,建立可大規模使用的訓練資料庫。
《SiliconANGLE》指出,Human Archive 一開始是使用 iPhone 錄製工作畫面,如今已改用超過六種不同設備,包括配備攝影機的頭戴裝置,目前有超過 1,000 名活躍使用者在工作時配戴設備進行資料蒐集。公司也會向參與的工作者支付報酬,並對願意接受資料蒐集的消費者提供折扣。Human Archive 主要透過印度零工平台取得資料,同時開發雲端服務,希望讓其他市場的使用者未來能上傳影像內容。
印度已有不少新創公司開始在工廠、物流與居家服務等不同工作場域蒐集第一人稱工作資料。為了與競爭對手做出區隔,Human Archive 不只錄製影片,還投入開發更多感測設備,包括觸覺手套、手腕攝影機與動作捕捉服,希望同步記錄人體動作、施力狀態,以及 RGB-D(彩色影像與深度資訊)等資料。
Human Archive 認為,單靠影像資料不足以訓練能在真實世界工作的 AI 機器人,若能結合觸覺、動作與環境感測資訊,資料價值將更高。公司早期曾使用臨時組裝或市售設備蒐集資料,如今則開始開發可互相協作的客製化硬體系統。目前 Human Archive 已部署超過 50 種不同設備,用來蒐集各類感測數據。
蒐集真人數據:Human Archive 面臨隱私與合作挑戰
Human Archive 的合作模式近期在印度引發爭議。公司表示,過去曾接觸多家印度居家服務平台尋求合作,但包括 Pronto 與 Urban Company 在內的部分業者並未接受。Urban Company 執行長 Abhiraj Singh Bhal 更直接在 X 發文表態,不會參與這類資料蒐集合作;Human Archive 團隊則認為隨著 AI 競爭加劇,相關企業未來可能重新評估合作可能性。
雖然未能打進部分大型平台,Human Archive 仍與一些較小型的新創合作,並透過折扣方案吸引消費者參與資料蒐集。當服務人員到府時,消費者可以在 App 上自行選擇:若同意工作過程被錄影,就能享有較低價格;若不希望被拍攝,則維持原價。Human Archive 執行長 Patel 表示,多數消費者其實願意接受錄影,因為居家服務經常發生服務品質糾紛,而影像紀錄能協助釐清責任。
在人員報酬方面,Human Archive 目前提供參與資料蒐集的工作者每小時 1 美元酬勞。《Economic Times》指出,其他同類公司給出的薪資通常更高,約為每小時 250 至 400 印度盧比(約 2.63 至 4.20 美元)。Patel 對此表示,Human Archive 在印度有在地據點和人力,所以能用比較低的報酬招募到工作者。
不過,錄影蒐集資料的做法也引來隱私疑慮。外界關注,工作者是否清楚了解自己的影像資料將如何被使用。Human Archive 表示,公司作法符合印度《數位個人資料保護法》(DPDP Act)規範,平台會提供隱私政策與資料使用說明,並取得使用者同意。公司強調,所有資料都會匿名化處理,錄影中的人臉會進行模糊化。
目前 Human Archive 的資料來源仍以印度為主,但公司已開始向東南亞與美國市場拓展,同時開發開放式平台,希望未來一般使用者能自行上傳影像並獲得報酬。公司也計畫在美國測試清潔、烹飪等到府服務,讓消費者透過接受資料蒐集來換取優惠價格,相關服務目前仍處於早期試驗階段。
多家科技新創積極投入實體 AI 發展,市場對真實世界工作數據的需求持續增加。Human Archive 正試圖搶占這塊市場。《TechCrunch》分析,這套模式未來能否真正擴大規模,仍取決於公司能建立多少合作關係,以及是否能持續取得大量且具差異化的訓練資料。
*本文開放合作夥伴轉載,資料來源:《TechCrunch》、《SiliconANGLE》、《Economic Times》,圖片來源:Unsplash。



