Nvidia新技術可減少20倍AI模型訓練資料量
Nvidia發(fā)展新的資料增強技術,可以大幅減少訓練人工智能模型所需要的資料量,研究人員僅使用來自大都會藝術博物館的一個小型資料集,就讓人工智能模型能夠創(chuàng)造出,過去可能需要數(shù)萬,甚至可能超過10萬訓練圖像,才能產生的精美圖像結果,而這項研究成果可用于廣泛的領域上,包括醫(yī)療保健等應用。
Nvidia將一種稱為ADA(Adaptive Discriminator Augmentation)的技術,應用在生成對抗網絡StyleGAN2模型上,使得訓練圖像的資料量,可大幅減少10到20倍,而且獲得同樣良好的效果。生成對抗網絡(GAN)的特性之一,便是訓練資料越多,模型產生的結果越好,生成對抗網絡由生成器(Generator)與判別器(Discriminator)兩個組件組成,生成器負責合成圖像,而判別器則要識別出圖像真?zhèn)?,并反饋有用的參?shù)給生成器,使得生成器之后能夠產生更好的結果。
但是一旦訓練資料不足,判別器便無法提供生成器足夠的信息產生好結果,就像是新手教練沒有夠多的經驗指導球員,球員也就難以精進球技一樣。因此生成對抗網絡通常需要5萬到10萬的訓練圖像,才能訓練出高品質的模型,但問題是,在許多使用案例上,并沒有足夠多的樣本圖像可以取用,僅以數(shù)千張圖像訓練生成對抗網絡,通常無法產生逼真的結果,而且會出現(xiàn)過適(Overfitting)的現(xiàn)象。
過去的研究也曾經以資料增強的方法,減少訓練生成對抗網絡所需要的資料量,但是結果并不好,因為生成對抗網絡反而學習了圖像旋轉變形等失真情形,無法產生逼真的合成圖像。而現(xiàn)在Nvidia所提出的ADA方法,可以適應性地應用資料增強方法,避免過適現(xiàn)象,而使得StyleGAN2等模型,可以使用更少的訓練圖像,并獲得良好的結果。
研究人員將這項結果應用在過去因為訓練資料太少,而難以實現(xiàn)的使用案例上,像是藝術家便使用StyleGAN進行創(chuàng)作,產生出各種精美繪畫,或是以傳奇插畫家Osamu Tezuka的風格,搭建新的漫畫,Adobe也應用該項技術,提供新的人工智能工具Neural Filters。
研究人員也提到,該項技術還有望應用在醫(yī)療保健領域,因為罕見疾病的醫(yī)學圖像很少,而且每個案例差異度很大,要大量收集有用的病理切片資料集很困難,而使用ADA技術的生成對抗網絡,則可改善這樣的問題。
- 上一篇:2020“中國高校計算機大賽-人工智能創(chuàng)意賽”收官 2020/12/10
- 下一篇:構建長期共贏生態(tài)圈 英特爾至強平臺加速人工智能落地 2020/12/10