小明永久免费大陆在线观看-小明永久免费视频-小明永久视频免费播放-小嫩妇好紧好爽再快视频-小嫩嫩12欧美-小日本xxx

首頁(yè) 新聞 > 科技 > 正文

機(jī)器學(xué)習(xí):亟須糾正的4大類“偏差”

偏見是指?jìng)€(gè)人對(duì)他人或其他群體所持有的缺乏充分事實(shí)依據(jù)的認(rèn)識(shí)和態(tài)度,而機(jī)器學(xué)習(xí)中的偏差則是由缺乏足夠的特征和用于訓(xùn)練模型的相關(guān)數(shù)據(jù)集不全面引起的。機(jī)器學(xué)習(xí)算法在訓(xùn)練中嚴(yán)格按照其數(shù)學(xué)構(gòu)造和數(shù)據(jù)執(zhí)行任務(wù),準(zhǔn)確完成人類所輸入的內(nèi)容,因此,機(jī)器學(xué)習(xí)模型的偏差通常是由設(shè)計(jì)和收集相關(guān)數(shù)據(jù)的人的“偏見”造成的。

數(shù)據(jù)科學(xué)家在構(gòu)建算法并對(duì)機(jī)器學(xué)習(xí)進(jìn)行訓(xùn)練時(shí),源自其本身某種程度的偏見會(huì)不可避免地蔓延到AI模型中,比較幸運(yùn)的是,機(jī)器學(xué)習(xí)的偏差能夠被檢測(cè)和規(guī)避。不過(guò),相關(guān)的研究人員仍需保持警惕。本文總結(jié)了需要了解和防范的4種不同類型的機(jī)器學(xué)習(xí)偏差以供參考。

1. 樣本偏差

樣本偏差是訓(xùn)練數(shù)據(jù)的問(wèn)題。當(dāng)用于訓(xùn)練模型的數(shù)據(jù)不能準(zhǔn)確地表現(xiàn)模型將運(yùn)行的環(huán)境時(shí),就會(huì)產(chǎn)生樣本偏差。沒(méi)有任何一種算法可以與整個(gè)宇宙環(huán)境的數(shù)據(jù)交互,并在這個(gè)宇宙環(huán)境中被訓(xùn)練,所以,選擇一個(gè)足夠大且具備代表性的宇宙子集來(lái)減輕樣本的偏差成為一門科學(xué)。盡管這門科學(xué)容易理解,但并非所有的數(shù)據(jù)科學(xué)家都接受過(guò)抽樣技術(shù)的訓(xùn)練。

舉一個(gè)自動(dòng)駕駛汽車的例子。當(dāng)訓(xùn)練一個(gè)在白天和夜晚都能使汽車自動(dòng)駕駛的算法時(shí),如果只選取了白天的數(shù)據(jù)進(jìn)行訓(xùn)練,這就等于在模型中引入了樣本偏差,用白天和夜晚的數(shù)據(jù)訓(xùn)練算法才可以消除樣本偏差的來(lái)源。

2. 偏見偏差

偏見偏差是由受文化和刻板印象影響的數(shù)據(jù)所引發(fā)的結(jié)果??梢韵胂笠幌拢僭O(shè)有一個(gè)計(jì)算機(jī)視覺算法正在接受訓(xùn)練來(lái)理解工作中的人們,而該算法暴露于數(shù)以千計(jì)的訓(xùn)練數(shù)據(jù)圖,其中許多圖像顯示的是正在寫代碼的男性和在廚房干活的女性,那么,該算法很可能會(huì)將編碼員等同于男性,將家務(wù)員等同于女性。這就是偏見偏差,因?yàn)楹茱@然女性也能夠?qū)懘a,而男人也可以做飯。

這里的問(wèn)題是,被選取的訓(xùn)練數(shù)據(jù)有意識(shí)地或無(wú)意識(shí)地反映了社會(huì)的刻板印象。要避免這樣的情況出現(xiàn),可以忽略性別和職業(yè)之間的統(tǒng)計(jì)關(guān)系,并使算法接觸均衡分布的示例。這顯然需要對(duì)刻板印象和偏見足夠敏感,而這則取決于人類對(duì)模型設(shè)定的表達(dá)行為的預(yù)期,僅靠數(shù)學(xué)無(wú)法克服這類偏差。負(fù)責(zé)標(biāo)記和注釋訓(xùn)練數(shù)據(jù)的工作人員必須接受相關(guān)的訓(xùn)練,以避免他們將自己對(duì)社會(huì)的偏見或刻板印象引入到訓(xùn)練數(shù)據(jù)中。

3. 計(jì)量偏差

如果用于觀察或測(cè)量的設(shè)備存在問(wèn)題,這會(huì)使系統(tǒng)價(jià)值失真,這種偏差趨向于使數(shù)據(jù)朝某個(gè)特定的方向偏離。例如,用帶有彩色濾光片的相機(jī)拍攝的每幅訓(xùn)練數(shù)據(jù)圖像都會(huì)出現(xiàn)顏色完全失真的情況,如此,用于訓(xùn)練算法的圖像數(shù)據(jù)實(shí)際上也沒(méi)有系統(tǒng)地表現(xiàn)出算法將運(yùn)行的環(huán)境。

這種偏差無(wú)法通過(guò)簡(jiǎn)單地?cái)U(kuò)大數(shù)據(jù)收集來(lái)避免,有效的途徑是,選取多個(gè)測(cè)量裝置并讓接受過(guò)訓(xùn)練的人員來(lái)比較這些裝置的輸出內(nèi)容。

4. 算法偏差

最后一種類型的偏差與數(shù)據(jù)無(wú)關(guān),屬于算法的數(shù)學(xué)性質(zhì)。一方面,具備高方差的模型可以很容易擬合到訓(xùn)練數(shù)據(jù)中并能接納復(fù)雜性,然而,這種模型對(duì)雜訊(又稱噪音noise)十分敏感;另一方面,具備高偏差的模型則更加剛硬,對(duì)數(shù)據(jù)和噪聲的變化不那么敏感,但容易丟失復(fù)雜性。因此,數(shù)據(jù)科學(xué)家需要在這兩個(gè)屬性之間達(dá)到適當(dāng)?shù)钠胶狻?/p>

數(shù)據(jù)科學(xué)家能通過(guò)了解這四種類型的AI偏差構(gòu)建出更好模型和選取更好的訓(xùn)練數(shù)據(jù)。AI算法是由人類構(gòu)建的,訓(xùn)練數(shù)據(jù)也是由人類收集、篩選、標(biāo)記和注釋的,因此,數(shù)據(jù)科學(xué)家需要敏銳地識(shí)別出這些偏差,并使用一種貫徹和迭代的方式來(lái)不斷測(cè)試模型,并吸納訓(xùn)練有素的研究員協(xié)助,最終規(guī)避這些機(jī)器學(xué)習(xí)的偏差。

關(guān)鍵詞: 機(jī)器學(xué)習(xí)

最近更新

關(guān)于本站 管理團(tuán)隊(duì) 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2018 創(chuàng)投網(wǎng) - www.zhigu.net.cn All rights reserved
聯(lián)系我們:33 92 [email protected]
豫ICP備2020035879號(hào)-12

 

亚洲av午夜精品无码专区 | 天美传媒一区二区 | 99国产精品久久久久久久日本竹 | 日本黄网站三级三级三级 | 麻豆一区二区三区蜜桃免费 | 欧洲乱码伦视频免费 | 中文字幕人妻丝袜成熟乱 | 人妻被按摩师玩弄到潮喷 | 夜夜爽日日澡人人添 | 久久久久综合网久久 | 国产丝袜无码一区二区三区视频 | 中文字幕无码不卡免费视频 | 插插射啊爱视频日a级 | 亚洲av乱码一区二区三区按摩 | 极品老师腿张开粉嫩小泬 | 国产精品无码av在线播放 | 久久成人激情视频 | 亚洲av无码国产精品麻豆天美 | 亚洲色偷拍区另类无码专区 | 国产剧情麻豆女教师在线观看 | 苍井空浴缸大战猛男120分钟 | 亚洲va中文字幕无码毛片 | 国产在线拍揄自揄拍无码视频 | 久久亚洲av午夜福利精品一区 | 国产亚洲精品福利在线 | 久久免费播放视频 | 国产成年无码v片在线 | 波多野结衣爽到高潮大喷 | 猫咪av成人永久网站在线观看 | 我把护士日出水了视频90分钟 | 国产精品久久久久久久久久直播 | 麻豆亚洲精品一区二区 | 久久国产色av免费观看 | 最近中文字幕在线mv视频在线 | 成人综合网站 | 风流少妇又紧又爽又丰满 | 精品久久久久久久无码 | 双乳奶水饱满少妇呻吟 | 桃花色综合影院 | 又色又爽又黄高潮的免费视频 | 怡红院免费的全部视频 |