物體識別_目標檢測_物體識別技術_SenseTime | 商湯科技


z6尊龙官方网站

申請試用
登錄
核心技術
以原創技術體係為根基,SenseCore商湯AI大裝置為核心基座,佈局多領域、多方向前沿研究,快速打通AI在各個垂直場景中的應用,向行業賦能。
關鍵技術
  • 01物體檢測
  • 02關鍵點定位
  • 03身份驗證
  • 04屬性識別
  • 05圖像聚類
  • 06真人檢測
  • 07肖像美顏
  • 08車型識別
  • 09場景識別
  • 10遥感图像解译
  • 11服装属性识别
  • 12视频摘要
  • 13视频内容结构化
  • 14短视频标签
  • 15文字识别
  • 16语音识别
  • 17自然语言处理
  • 18机器人控制与传感

01 / 018

物體檢測

運用商湯科技領先全球的通用物體檢測算法,能有效地檢測出圖片中常見的物體。

02 / 018

關鍵點定位

可以支持不同精準度的面部關鍵點定位,快速(以毫秒計算)為眼、口、鼻等面部輪廓的21、106、240 個關鍵點定位。除此以外,它亦可定位移動端 14 個身體關鍵點,只要通過 RGB 圖像輸入,即可實時為頭、肩、腰和腿的位置定位,並可適用於各種大幅度的動作,根據不同實際環境中作出變化,包括不同角度的側臉、不同表情的變化、遮擋、模糊以及明暗的變化等等。

03 / 018

身份驗證

可以判斷兩張照片是否屬同一個人並只有百萬分之一的誤識別機會率,準確度超過99%。

04 / 018

屬性識別

準確地識別多種屬性類別,例如顏色、形狀、類型、性別和表情等。

05 / 018

圖像聚類

支持快速圖像聚類,例如用於智能相冊,更方便管理照片。

06 / 018

真人檢測

通過分辨高清照片、PS圖、3D模型和換臉等不同的仿冒方式,可以有效的檢測攝像頭前的用戶是否為真人操作。我們更可針對不同場景的需求提供定製化的解決方案,例如可配合身份認證能力,為金融等高安全性要求的嚴肅應用場景提供真人身份驗證。

07 / 018

肖像美顏

運用商湯科技智能圖像內容檢測定位技術,打造移動端美顏、美妝效果的解決方案,讓當今移動互聯網的時代更有娛樂性,更有“美”可依。

08 / 018

車型識別

實現各種場景下都可精準識別到大量各式各樣的車型,克服了不同場景、不同光照和拍攝角度變化所帶來的影響。

09 / 018

場景識別

精準地識別自然環境下的數百種場景以及上至千種通用物體及其屬性,方便智能相冊基於場景或者物體的內容進行管理、照片檢索和分類、甚至廣告推薦的功能。

10 / 18

遥感图像解译

实现对高空间、时间分辨率卫星影像智能化信息提取,面向土地利用类型分类与典型地物提取,点状、面状目标检测和动态变化监测三大任务。

11 / 18

服装属性识别

自动检测和识别图片、视频中的服饰,准确识别服饰品类、花纹、袖型、领型等特征,显著抵抗光照与姿态变化等干扰因素的影响。

12 / 18

视频摘要

基于原创的深度学习算法,智能分析长视频中每个镜头的内容和风格,找出各镜头中的场景和活动等的内在联系,提炼并汇集重点信息,以短视频形式呈现,已经应用于电视、互联网等行业。

13 / 18

视频内容结构化

通过自动分析和提取视频中的有价值素材(比如时尚服饰、场景、商标、商品和行为等),提供丰富的结构化信息,可用于高效的视频素材管理和精准营销。

14 / 18

短视频标签

基于业内领先的大规模多标签算法,自动理解视频的内容,自动生成文本标签,帮助提升视频搜索和推荐的精准度。拥有完善的标签体系,已经落地于移动互联网、电视、广告等多个行业。

15 / 18

文字识别

a)自然场景类:自动提取复杂的自然场景图片中的文字信息。
b)卡证类:在各种拍摄环境下,自动提取卡证图像中的文字信息。
c)票据类:提供不限版式的多种类票据的识别,并根据所在位置自动组织结构。

16 / 18

语音识别

a) 语音识别:自动将音频内容转化为文字信息。
b) 关键词检测:处于休眠状态下的设备通过唤醒直接进入语音交互,或者通过指令词识别控制智能设备。
c) 声纹识别:通过独特的音频特征识别和确认说话人身份。

17 / 18

自然语言处理

a) 自然语言理解和生成:文本表示学习,基于知识的语义理解,可控的文本生成等方向。
b) 对话系统:任务导向型对话系统,知识问答多轮对话系统。

18 / 18

机器人控制与传感

a) 机器人仿真平台:
利用机器人仿真平台灵活改变实验设置,快速获取所需数据,从而对自主抓取策略与机器学习算法进行有效测试和验证。仿真平台采用模块化的架构,关键模块可根据应用需要进行更新和替换,仿真中的关键数据可存取。
b) 3D视觉引导的机器人随机分拣技术:
通过分析 3D 视觉信号精确估计复杂场景中堆叠物体的 6D 姿态,通过碰撞检测和运动规划算法引导机器人以指定的方式抓取堆叠状态下的目标物体。此核心技术可以应用于工业柔性生产装配、上下料、物流分拣、码垛、拆垛等行业领域。
c) 视觉驱动的机械臂物体操作技术:
通过深度学习和强化学习方法使机械臂可以进行自主学习。基于视觉传感器驱动的多物体操作任务(如物体的抓取、放置和零件装配)可以有效地降低硬件和系统集成成本。同时,算法可以在仿真环境下采集训练样本然后迁移至现实环境,从而减少现场调试开销。此项技术提升了机器人在定制化产品智能工业生产线以及多品类物体的物流分拣等工业场景中的灵活性。

通用人工智能
  • 物體檢測
  • 關鍵點定位
  • 身份驗證
  • 屬性識別
  • 圖像聚類
  • 真人檢測
  • 肖像美顏
  • 車型識別
  • 場景識別
  • 遥感图像解译
  • 服装属性识别
  • 视频摘要
  • 视频内容结构化
  • 短视频标签
  • 文字识别
  • 语音识别
  • 自然语言处理
  • 机器人控制与传感

01 / 018

物體檢測

運用商湯科技領先全球的通用物體檢測算法,能有效地檢測出圖片中常見的物體。

02 / 018

關鍵點定位

可以支持不同精準度的面部關鍵點定位,快速(以毫秒計算)為眼、口、鼻等面部輪廓的21、106、240 個關鍵點定位。除此以外,它亦可定位移動端 14 個身體關鍵點,只要通過 RGB 圖像輸入,即可實時為頭、肩、腰和腿的位置定位,並可適用於各種大幅度的動作,根據不同實際環境中作出變化,包括不同角度的側臉、不同表情的變化、遮擋、模糊以及明暗的變化等等。

03 / 018

身份驗證

可以判斷兩張照片是否屬同一個人並只有百萬分之一的誤識別機會率,準確度超過99%。

04 / 018

屬性識別

準確地識別多種屬性類別,例如顏色、形狀、類型、性別和表情等。

05 / 018

圖像聚類

支持快速圖像聚類,例如用於智能相冊,更方便管理照片。

06 / 018

真人檢測

通過分辨高清照片、PS圖、3D模型和換臉等不同的仿冒方式,可以有效的檢測攝像頭前的用戶是否為真人操作。我們更可針對不同場景的需求提供定製化的解決方案,例如可配合身份認證能力,為金融等高安全性要求的嚴肅應用場景提供真人身份驗證。

07 / 018

肖像美顏

運用商湯科技智能圖像內容檢測定位技術,打造移動端美顏、美妝效果的解決方案,讓當今移動互聯網的時代更有娛樂性,更有“美”可依。

08 / 018

車型識別

實現各種場景下都可精準識別到大量各式各樣的車型,克服了不同場景、不同光照和拍攝角度變化所帶來的影響。

09 / 018

場景識別

精準地識別自然環境下的數百種場景以及上至千種通用物體及其屬性,方便智能相冊基於場景或者物體的內容進行管理、照片檢索和分類、甚至廣告推薦的功能。

10 / 18

遥感图像解译

实现对高空间、时间分辨率卫星影像智能化信息提取,面向土地利用类型分类与典型地物提取,点状、面状目标检测和动态变化监测三大任务。

11 / 18

服装属性识别

自动检测和识别图片、视频中的服饰,准确识别服饰品类、花纹、袖型、领型等特征,显著抵抗光照与姿态变化等干扰因素的影响。

12 / 18

视频摘要

基于原创的深度学习算法,智能分析长视频中每个镜头的内容和风格,找出各镜头中的场景和活动等的内在联系,提炼并汇集重点信息,以短视频形式呈现,已经应用于电视、互联网等行业。

13 / 18

视频内容结构化

通过自动分析和提取视频中的有价值素材(比如时尚服饰、场景、商标、商品和行为等),提供丰富的结构化信息,可用于高效的视频素材管理和精准营销。

14 / 18

短视频标签

基于业内领先的大规模多标签算法,自动理解视频的内容,自动生成文本标签,帮助提升视频搜索和推荐的精准度。拥有完善的标签体系,已经落地于移动互联网、电视、广告等多个行业。

15 / 18

文字识别

a)自然场景类:自动提取复杂的自然场景图片中的文字信息。
b)卡证类:在各种拍摄环境下,自动提取卡证图像中的文字信息。
c)票据类:提供不限版式的多种类票据的识别,并根据所在位置自动组织结构。

16 / 18

语音识别

a) 语音识别:自动将音频内容转化为文字信息。
b) 关键词检测:处于休眠状态下的设备通过唤醒直接进入语音交互,或者通过指令词识别控制智能设备。
c) 声纹识别:通过独特的音频特征识别和确认说话人身份。

17 / 18

自然语言处理

a) 自然语言理解和生成:文本表示学习,基于知识的语义理解,可控的文本生成等方向。
b) 对话系统:任务导向型对话系统,知识问答多轮对话系统。

18 / 18

机器人控制与传感

a) 机器人仿真平台:
利用机器人仿真平台灵活改变实验设置,快速获取所需数据,从而对自主抓取策略与机器学习算法进行有效测试和验证。仿真平台采用模块化的架构,关键模块可根据应用需要进行更新和替换,仿真中的关键数据可存取。
b) 3D视觉引导的机器人随机分拣技术:
通过分析 3D 视觉信号精确估计复杂场景中堆叠物体的 6D 姿态,通过碰撞检测和运动规划算法引导机器人以指定的方式抓取堆叠状态下的目标物体。此核心技术可以应用于工业柔性生产装配、上下料、物流分拣、码垛、拆垛等行业领域。
c) 视觉驱动的机械臂物体操作技术:
通过深度学习和强化学习方法使机械臂可以进行自主学习。基于视觉传感器驱动的多物体操作任务(如物体的抓取、放置和零件装配)可以有效地降低硬件和系统集成成本。同时,算法可以在仿真环境下采集训练样本然后迁移至现实环境,从而减少现场调试开销。此项技术提升了机器人在定制化产品智能工业生产线以及多品类物体的物流分拣等工业场景中的灵活性。

商務合作

申請試用

體驗商湯科技的產品和服務,填寫簡短表格我們盡快聯系您

申請試用

合作夥伴招募

成為合作夥伴,與商湯科技共同推動 AI 在各行業的應用落地。

合作夥伴招募