笃定有光 自有力量|专访深圳市五一劳动奖章获得者杨磊
2024年5月,深圳市总工会公布了一批深圳市五一劳动奖章的获奖名单,来自商汤的杨磊荣登榜单。这一荣誉是对他过往杰出的工作表现和敬业精神的认可。
本科毕业于清华大学,博士毕业于香港中文大学,师从林达华教授和汤晓鸥教授,作为研究院内容生成部门的leader,杨磊带领20余人的团队专注于3D内容生成领域的研发,他们构建了低成本的动作捕捉和生成系统、虚拟数据生成平台、虚拟人直播带货软件,并推出了OpenXRLab开源平台等项目,这些成果在商业和学术领域均产生了广泛的影响。
特别是随着2023年语言大模型技术突破带来了新一轮的人工智能热潮,结合这一技术变革,团队利用语言大模型的文本生成和问答能力,带领团队研发了24小时虚拟人直播带货产品,不仅让虚拟主播通过线上无人直播成交了订单,提供了流量变现渠道,而且商汤自主研发的多个虚拟IP角色,在抖音、快手和小红书等平台累计拥有几百万的粉丝和超10亿的播放量,在二次元盛行的时代有效提高了商汤的原创技术品牌影响力。
如今,他们正在孜孜以求地探索大模型时代下3D内容生成的更多可能。
让虚拟人不再是普通人眼中的“阳春白雪”
在杨磊看来,世界的本质宛如一幅立体的画卷,3D的精髓贯穿其中。近年来,在致力于虚拟数字人的研发中,他始终坚信日常信息的传递与接收是与3D世界深度交互的体现。而3D数字人,便是这一理念在当前时代落地生根的璀璨之花。然而,3D技术的完善并非一蹴而就,从数据的积累到算法的打磨,需要长时间的沉淀与精进。关键在于构建商业闭环,使虚拟数字人能够持续发展,最终不再是“吉祥物”的存在,而是以亲民的价格惠及普罗大众,让每个企业和每个普通人都能领略和享受到虚拟数字人的魅力。
他们在3D技术的研发中大胆探索,试图提取出关键问题,并进行难点攻克,这些关键问题涉及3D数据的规模化获取、跨模态的3D模型生成和驱动等方面。在研发过程中,多篇论文分别被计算机国际顶级会议SIGGRAPH, NeurIPS, CVPR等和计算机国际顶级期刊T-PAMI等接收。
用十分定力,做一件难而正确的事情
利用3D技术的可控性、可编辑性、可交互性,积极拥抱视频生成大模型的挑战,杨磊及其团队一直潜心探索属于自己的技术商业化道路。在商业化闭环的征途上,他们精心布局IP的流量矩阵,通过无人直播的方式,实现规模化流量转化为实际效益。为了3D技术技术更加亲民,他们研发简易创作工具,拓展普通创作者的能力边界。同时,他们还致力于将3D视频生成技术解决方案提供给专业团队,助力提高他们的工作效率。此外,他们与和B端产品紧密合作,希望为垂直领域行业带来直接有效的解决方案……
然而这是一条少有人走的路,并非一帆风顺,在落地过程中遇到种种难以想象的困难。有的因为技术尚未成熟带来的困扰,有的因为平台规则的限制,还有些则是投入产出比不尽如人意。但正如在仅有一丝微光的山洞里摸索前行,虽无前人经验可借鉴,亦无捷径可走,但杨磊一直心怀积极乐观的态度,“把自己当成一个大模型接受Hard cases的训练”他微微一笑,“找最优解是困难的,但找一个更优解通常是可达的。”
在纷乱复杂的世界做一个长期主义者
在2024年春节,OpenAI的首款文生视频模型—Sora的发布,无疑为全球科技界投下了一颗重磅炸弹。在AGI时代的风口浪尖,GPT-4o已经展现出强大的跨模态能力,轻松驾驭文字、语音、图像等多种输入输出方式。
杨磊乐观而理性地分析,随着技术的进步,3D这一模态也将成为大模型家族中不可或缺的一员。随着手机等移动设备的广泛普及,视频和交互式数字人成为了积累3D数据的重要途径。他们不仅丰富了我们的数字生活,更为3D技术的发展提供了宝贵的经验和数据支持。未来,随着VR设备的普及,人们将更加直观地接触到原生3D世界,享受沉浸式体验带来的乐趣。同时,通过机器人或其他智能设备,3D技术将拥有直接影响物理世界的能力,开启全新的智能交互时代。
对商汤而言,无疑拥有充分的自身优势。作为长期主义的坚定信仰者,杨磊深信无论是公司还是个人,唯有持之以恒的专注与投入,才能将事情做到极致与深入。商汤拥有浓厚的研究氛围,虽然也是被外界所争议的双刃剑,然而正是这种对原创技术不懈追求的精神,激励着每一位研究者不轻言放弃,以更开放的姿态深入技术底层钻研。
自驱力是行稳致远的力量
这位自诩“成长速度并不飞速”的90后,展现出别样的沉稳与深度。他是个外表温和、内心坚定,深藏不露的“i人”,拥有既专注又松弛,自律又豁达的性格特质。他热爱网球,疾驰于球场上,那种将喜爱的事物做到极致的投入感让他沉醉其中,成为实现自我的最佳途径。
正如雷军所言,自驱力是创新能力的引擎。这位从小到大的“学霸”,他说:“我的自驱力源自于和同伴将事情做成的追求、成长的渴望,以及对未知领域的好奇。”这样的自驱力让他面对困难和挑战时,总能保持冷静和坚定,不断寻找新的办法。也许他的成长速度并不飞速,但每一步都走得坚实有力。
作为管理者,他努力营造知识分享的开放氛围,从团队目标到技术路线,大家都充分辩论,让每个人的声音都得到尊重和看见。但他更希望自己未来成为一名“专才”,和团队那些同样年轻的小伙伴一起,持续学习,积累研究与工程的能力和对这个世界的理解和认知,专注耕耘于自己的专业地盘,成为这个细分领域里金字塔尖的那批人。
当下,虽然虚拟数字人和视频生成都是AI赛道炙手可热的“香饽饽”,但商业化之路依旧挑战重重。将技术切实转化为新的生产力,帮助企业实现降本增效、实现业务前端用户的触达,这也意味着杨磊和他的团队需要加倍努力,才能在“百舸争流”中占据先机。
如王阳明所言“吾心光明,亦复何言”,持平常心,守光明心。摘得荣誉对杨磊来说,只是苦心钻研技术之路上的一个小小里程碑,他将继续深耕于3D内容生成领域,带领团队坚定前行,在追寻星辰的征途中穿越山海。