當(dāng)你老了,人工智能還能認(rèn)出你嗎?
?人工智能技術(shù)“御眼重明2.0”
往期回顧
沒有情緒的人工智能如何識別人類的情緒? | 機(jī)智過人
撰文 | 陳燕惠
責(zé)編 | 程 莉
● ● ●
在影視劇中,我們常??吹竭@樣的橋段——祖孫或者母女用同一個演員飾演來暗示他們之間的血緣關(guān)系,但事實上,從遺傳學(xué)的角度看,人的相貌基因在遺傳時總是遵循“相乘后再平均”法則的。因此直系親屬之間,所隔代數(shù)越多,長相的相似度是呈指數(shù)級遞減的。
研究表明隔代直系親屬之間面部越來越中和,難以尋找祖輩之間明顯的基因特征。此外,現(xiàn)在很多少數(shù)民族的特有面貌,也因為人類發(fā)展、血統(tǒng)發(fā)展而逐步消失,比方說彝族,一般認(rèn)為都是瘦小精干,大眼睛,現(xiàn)在也出現(xiàn)了三角眼、高大粗壯體型。
在這樣一個前提下,如何根據(jù)家庭成員的容貌在茫茫人海中鎖定失蹤多年的孩子呢?以便進(jìn)一步DNA鑒定確認(rèn)。
見微知著的跨代人臉識別技術(shù)
9月15日晚8點,在《機(jī)智過人》第二季第五期的節(jié)目中,云從科技聯(lián)合創(chuàng)始人姚志強(qiáng)帶來的人臉識別技術(shù)“御眼重明2.0”將采取結(jié)構(gòu)光的技術(shù)挑戰(zhàn)跨代的辨識能力,即通過祖輩尋找孫輩。而與之分庭對抗的則是來自山東青島市刑警支隊,擁有15年模擬畫像經(jīng)驗的崔娟警官。
?崔娟警官展示模擬畫像
據(jù)崔警官介紹,模擬畫像不僅僅是畫像,還包含顱骨復(fù)原、人臉識別兩個重要技能。優(yōu)秀的模擬畫像靠的是七分交流以及三分刻畫,即通過和描述人聊天,并從其只言片語中挖掘關(guān)鍵信息,以達(dá)到尋找失蹤人口和找到刑事犯罪的嫌疑人等目的。此外,崔警官也表示爺孫之間模擬畫像相似度最高為70%左右。如果跨的代數(shù)更多,年齡跨度太大,相似度可能會銳減到20%左右。
與模擬畫像相比,人工智能技術(shù)“御眼重明2.0”在隔代直系親屬的識別中,父母與孩子之間的識別率大約是74%~80%,而祖孫跨代,識別率最高為78.16%,最低是19.14%。
節(jié)目現(xiàn)場,來自國家廣電總局老年合唱團(tuán)的多名檢驗助理協(xié)助雙方展開挑戰(zhàn)?!坝壑孛鳌焙痛蘧昃傩枰ㄟ^給定的4個孩子模糊的面部拓本,和整個合唱團(tuán)成員的面部進(jìn)行分析比對,并找出4位孩子的祖輩。從上述數(shù)據(jù)對比結(jié)果來看,兩種不同方法的人臉識別率(跨越3代直系親屬)不相上下,因此究竟是機(jī)智過人還是技不如人在挑戰(zhàn)開始前也充滿了不確定性。
挑戰(zhàn)雙方最終都完成了任務(wù),但“御眼重明2.0”技術(shù)通過大樣本的數(shù)據(jù)學(xué)習(xí)和優(yōu)化的算法匹配跨越3代的祖孫倆,以更快的識別速度獲得了最后的勝利。
人工智能如何識別人臉?
人臉識別技術(shù)主要通過對輸入的人臉圖像或者視頻流,以及每個人的主要面部器官位置信息進(jìn)行保存和分析,進(jìn)而提取其中所蘊涵的身份特征,并將其與已知的人臉進(jìn)行對比,從而達(dá)到識別身份的目的。
20世紀(jì)60年代,德州大學(xué)奧斯汀分校的Woody Bledsoe開發(fā)了一種系統(tǒng),通過一種電子平板手動對人臉照片進(jìn)行分類。該系統(tǒng)可用于手動記錄各種面部特征的坐標(biāo)位置,包括眼睛、鼻子、發(fā)際線和嘴巴,將這些度量標(biāo)準(zhǔn)插入數(shù)據(jù)庫中,然后再將新照片和數(shù)據(jù)庫中存儲的圖像進(jìn)行比對。由于時代的限制,手工標(biāo)記的方法存在費時費力和精確度低等諸多缺點,未能向智能化時代邁進(jìn)。
1988年,來自布朗大學(xué)的Sirovich和Kirby開始將線性代數(shù)應(yīng)用于面部識別問題,并提出通過特征臉(Eigenface)進(jìn)行人臉識別的概念。隨后,MIT的研究者M(jìn)atthew Turk和AlexPentland經(jīng)過多次嘗試終于實現(xiàn)了自動化面部識別。目前,隨著計算機(jī)技術(shù)和光學(xué)成像技術(shù)的發(fā)展得到不斷提高,來自Facebook,Google以及我國創(chuàng)業(yè)團(tuán)隊Face++的研究者相繼取得了突破性的進(jìn)展,實現(xiàn)97%以上的準(zhǔn)確率,接近了人類的測試水平。
?一些特征臉
和以往相比,現(xiàn)代人工智能取得了巨大的進(jìn)步,主要體現(xiàn)在以下幾個方面。
1)光學(xué)成像技術(shù)和計算機(jī)的發(fā)展提高了采集圖像的質(zhì)量。
2)在人臉圖像預(yù)處理的過程中采用多種方法,包括光線補(bǔ)償、灰度變換、直方圖均衡化、歸一化、幾何校正、濾波以及銳化等。
3)人臉檢測過程中提取豐富的人臉表征并強(qiáng)調(diào)不同面部特征對識別結(jié)果的貢獻(xiàn)度不同,例如人臉的上半?yún)^(qū)域?qū)ψR別的重要性明顯高于下半?yún)^(qū)域。
4)在人臉圖像匹配過程中集成了人工智能、機(jī)器識別、機(jī)器學(xué)習(xí)、模型理論、專家系統(tǒng)、視頻圖像處理等多種專業(yè)技術(shù)。
目前,F(xiàn)acebook的DeepFace系統(tǒng)將深度學(xué)習(xí)方法引入人臉識別系統(tǒng),而2015年Google的FaceNet則首次將“三元組”距離度量引入人臉識別,引領(lǐng)了一系列后續(xù)研究。這一系列研究的特點均是采用深度學(xué)習(xí)方法構(gòu)建系統(tǒng),運用百萬以上的人臉數(shù)據(jù)進(jìn)行訓(xùn)練,歷史上首次將人臉識別系統(tǒng)發(fā)展到可以大規(guī)模商業(yè)運用的成熟度。
人臉識別技術(shù)的局限性
盡管人臉識別技術(shù)充斥在人們?nèi)粘I畹姆椒矫婷嬷?但該技術(shù)仍有許多局限性,例如光照的變化會大大影響人臉的外觀,從而影響識別的性能。此外,系統(tǒng)采集到的圖像和視頻流中可能會出現(xiàn)面部遮擋,形變(大笑)、側(cè)臉等現(xiàn)象。因此,在諸多條件的限制下,神經(jīng)網(wǎng)絡(luò)很難提取出與“標(biāo)準(zhǔn)臉”相似的特征,導(dǎo)致識別和驗證失敗。
從另一個角度而言,隨著年齡的增長,人的臉部會發(fā)生變形并伴隨皮膚和軟組織的改變,例如抬頭紋、眼角下垂、口角脂肪松垂、魚尾紋、色素堆積和毛孔變大。耶魯大學(xué)的DerekM.Steinbacher 教授認(rèn)為“皮膚磨損”和環(huán)境暴露是導(dǎo)致面部衰老的主要原因之一。
首先,面部衰老是一個正常的生理過程,性別、生活地域、疾病和保養(yǎng)造成的衰老存在著差異,但都有一些共同特征。年輕人群有清晰明確的間隔和完整附屬組織使皮膚和面部結(jié)構(gòu)位于適當(dāng)位置,因此皮膚緊致、面部輪廓清晰并且骨相明顯,而老年人的面部卻略帶“苦相”,猶如蠟燭融化一般出現(xiàn)明顯的下垂和松弛現(xiàn)象,頰骨輪廓模糊。
其次,隨著時間的推移,皮膚會遭到損傷,這將導(dǎo)致皮膚出現(xiàn)皺紋、暗斑,甚至腫瘤。長期的陽光照射會損傷彈性纖維,導(dǎo)致它們出現(xiàn)不規(guī)則積聚,膠原纖維數(shù)量減少,其余纖維組織紊亂。此外,吸煙等其他不健康的生活方式也會加速面部老化的進(jìn)程。
“御眼重明2.0”技術(shù)如何跨代識別?
盡管年齡是影響人臉識別成功率的關(guān)鍵因素,但是有一些幾何特征并不會隨著年齡變化而改變。
“御眼重明2.0”技術(shù)正是通過海量樣本的聚類分類訓(xùn)練以及結(jié)構(gòu)光的技術(shù),提取人臉的深度特征點、構(gòu)造比例和長度特征,構(gòu)建貝葉斯網(wǎng)絡(luò),迅速鎖定對象。正是由于獲取了面部的立體信息,才實現(xiàn)了跨越年齡的臉部識別。
?人臉圖像特征提取
在未來生活中,人臉識別這項集成了人工智能、機(jī)器學(xué)習(xí)、理論構(gòu)建和圖片處理等等多種專業(yè)技術(shù)的系統(tǒng),將在需要識別身份的場景中得到廣泛的運用,例如物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、銀行、安防、刑偵和交通等,并且真正實現(xiàn)人身和信息的安全。