- 商湯動態
- 堅持原創,讓 AI 引領人類進步
AR爆款應用背後的故事
欒青
中國科學技術大學計算機視覺博士
主要研究方向為計算機視覺和圖像藝術
曾任職於美國微軟總部Bing團隊
先後擔任研發和產品經理工作
加入商湯以來
她帶領團隊從0到1
打造商湯增強現實感繪製引擎SenseAR
緣結計算機視覺,在商湯拓展新視野
商湯:可以聊一下您的個人經歷嗎?為什麼會選擇從事計算機視覺方面的研究?
欒青:我小時候一直喜歡畫畫,希望自己能夠成為一名畫家,進入計算機視覺領域純粹是機緣巧合。高考的時候我報讀了生物科,後來被調到通信專業,一個偶然的機會,我發現學校有一個圖像處理的實驗室,他們主要做圖像超分、圖像降噪、視覺重建這些基礎的計算機視覺工作,可以把圖像變成有趣的風格,這跟我喜歡畫畫正好有些關聯。
從那時起,我開始接觸計算機視覺方面的基礎知識,開始做一些初步的研究。當然,真正步入計算機視覺領域是由加入微軟亞洲研究院開始,很幸運在那遇到了我的導師沈向洋博士,他是計算機視覺領域的泰斗級人物。
商湯:那時的計算機視覺行業是怎樣的?在微軟您主要從事哪些方面的研究?
欒青:那時候的計算機視覺還沒有達到工業界的紅線,人臉識別準確率能達到60-70%已是很了不起,技術能落地的案例就更少了。所以大部分從業者都選擇去學校當老師,或者在學校進一步深造,我也跟著我的老闆去美國微軟Bing團隊做搜索引擎。
2015年回國之後,我才發現深度學習領域變得很受歡迎,圈子裡的人跟我說它能做到很多以前我們做不到的事情,但是我仍然半信半疑,因為之前的經歷告訴我計算機視覺是不可能達到實用水平的。來到商湯後我才明白,人工智能/計算機視覺可以那麼快就觸達工業紅線。
商湯:您覺得深度學習還有哪些困難?
欒青:現在的深度學習還是個“黑匣子”,知其然但不知其所以然。我們知道通過結構設計和深度擴展再加上數據支持就能夠讓計算機做出最終判斷,可是至於它為什麼會這麼做我們暫時還是沒有辦法尋根溯源。
小團隊深耕新領域,女性PM更佔先機
商湯:是什麼原因讓商湯當初選擇並深耕在這個領域呢?是不是很耗人力和財力呢?
欒青:我們其實沒花什麼人力和財力(笑),團隊也很小,可能只有其他大公司團隊的十分之一。
許多同行都並沒有涉足這個方向,而我們一直覺得中國互聯網是一個很有意思的市場:一方面這個市場很大,頭部領頭羊效應非常明顯;另一方面中國互聯網那時正趕上一波非常大的熱潮—正是處於3G到4G之間的轉換期,是從文字到影片轉換的階段,因此我們認為在影片應用上一定會有非常多有趣的新應用需要新的工具來承載。
其實文字時代出現了很多互聯網工具,但影片的時代幾乎沒有新的工具能讓用戶通過影片來表達自己。我們當時看好的不是那個時候做的一兩個產品的發展,而是看好中國互聯網影片市場所迎來的風起雲湧,深信作為視覺理解為核心能力的CV技術一定有很多機會。
商湯:作為女性從事科技創業,您覺得是帶來了更多的優勢,還是障礙?
欒青:其實作為產品經理,女性也有很大的優勢,因為我們更能全面了解女性。
我們一定要明確一個概念,女性並不是為了男性去變美,在女性的群體裡,她們自己也希望美美的,這是一種自我表達的天性。我們現在做的大部分產品也是為女性自己喜歡的表達去做的功能,比如美妝、皮膚檢測這些功能其實都跟女性本身的一些需求有關。
AI+互娛,中國市場大有可為
商湯:人工智能可以賦能到很多行業,在互娛行業的應用與其他行業有什麼不同?
欒青:最大的不同是客戶的性質不同。互娛是一個客戶量很大、迭代周期非常短的一個場景,所以我們產品節奏也很快,要不斷滿足新的需求。而且很多產品是在線上不斷迭代的,壓力也會非常大。一般來說一周發佈四五個版本都很正常,我們一年都能發佈好幾百甚至上千個版本,才能跟上客戶的節奏。
但相比智慧城市、金融、教育等其他業務,我們的客戶有一個非常大的優勢:趨同性非常強。產品也更容易標準化,客戶的定制化需求相對較少。
商湯:相比其他業務,互娛是最接近C端的。
欒青:對,實際上是B2B2C,我們的產品直接可以提供用戶使用,一定程度上不用完全跟隨客戶需求,更多的是跟著用戶的需求。比如2018年發布的美體瘦身,就是我們最初認為用戶需要,才研發了這麼一個產品。
商湯:臉部特效最早是在美國出現的,為什麼後來中國比美國更火?
欒青:其實有兩個原因:一個原因中國的短視頻創業者更多,一定程度上也是因為中國比美國在4G的普及上範圍人群更大。另一個是智能手機的普及導致中國有很多細分市場,再加上中國用戶有很強的從眾心理,群體效應很強,中國市場本身就是很活躍的。
精益求精,5G時代促互娛體驗升級
商湯:2018年商湯在互娛行業有很多產品落地,包括美體塑形、ZEPETO、SNOW相機等等,您覺得商湯取得優異成績的原因是什麼?
欒青:也算不上非常大的成績,我對自己去年的表現並不是非常滿意。過去我們從臉部、肢體到全身的特效各個點都擊破了,但我們還是希望能提供一個新商業模式的平台,這是我今年會繼續努力做的事情。
在湖南衛視原創科技秀綜藝《我是未來》第二季節目中,欒青博士向大家生動展示了SenseAR技術。
在節目的最終挑戰環節,產品還成功為現場熱舞的人進行實時瘦身的極限挑戰,收穫全場觀眾的熱情反饋。
最終,SenseAR以節目有史以來最高霸屏指數96%,戰胜對手進駐未來科技館。
商湯:5G時代,互娛行業會有怎樣的變化?
欒青:我前一段時間也一直在想,我們是不是真的能夠判斷到最終的終局,因為終局是由很多因素一起撮合而成的,我們很難去判斷哪一些因素是有用的。但從3G到4G的變化過程中,你可以看到信息的維度在增加,從文字、圖片到影片......當你有更大的頻寬,如何用新的體驗把用戶流量填滿,正是我們在考慮的問題。
5G將帶來更大的頻寬和更少的延時,傳輸速度也會更快。它將讓互娛、手機、醫療、教育、新零售行業等以前無法提供的功能成為可能。我們目前看到AI對圖像的處理比較多,有了5G之後會有更多對3D數據的處理。 5G的到來將有助大力地推動3D產業的爆發,其觸覺能力會嵌入更多應用,人們將獲得身臨其境的體驗。
擁抱變化,探見不凡
來商湯,be a SenseMaker
期待你與商湯共同成長