AI感知分析
进而对自身的决策进行优化,从而拥有专家级别的实力,辅助人类做出决策。 目前听到在做认知智能的企业非常少。
AI感知分析
图像识别
面部识别
语音识别
语音信号处理
OCR
图像识别主要基于图像特征点的提取与匹配,是AI视觉的重要部分。我司依靠自主研发的深度学习算法和相关产品,通过数据训练可以对前端图像数据进行高精度实时识别分析。技术主要应用于图像对比、图像跟踪、安全监测等方面。
面部识别基于人的脸部特征信息进行身份识别的一种生物识别技术。我司依靠自主研发的深度学习算法和相关产品拥有全面自研的人脸信息分析能力,包括人脸检测与矫正,属性识别,人脸比对和搜索,多模态活体检测等;针对性优化复杂光照和遮挡场景,支持戴口罩人脸识别通行。
语音识别(Automatic Speech Recognition,ASR)主要是将语音转换为文字,利用AI对语音进行自动识别和处理的技术。语音识别主要包括离线语音识别和实时语音识别。通过大量训练数据进行深度学习,使得系统能够识别和理解各种语音信号并进行预处理,剔除噪声和干扰,提取出有效的语音特征通过语音识别算法将语音信号转化为文本信息。
语音信号处理 (Speech Signal Processing)主要用于分析通过麦克风采集语音波形转换的电信号并且可以将模拟电信号转换为其他形式用于语音识别,语音合成和语音编码等任务,并可直接用于音高提取,共振峰估计,以及表征语音声学特征等应用。语音信号处理主要应用于人机对话等领域。
光学字符识别(Optical Character Recognition, OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。亦即将图像中的文字进行识别,并以文本的形式返回。简单可以理解为OCR⽂字识别技术。主要应用于文字、表格、卡片等识别,也包括二维码等图像识别。技术核心是识别准确率,与软硬件均有一定关系。