语音识别场景
-
汽车数字孪生:边缘计算带来更好的智能驾驶应用场景
芝能科技出品 智能交通的快速发展,汽车数字孪生技术在边缘计算的赋能下,正成为推动未来出行变革的核心驱动力。《汽车数字孪生用例》白皮书深入剖析了该技术在道路交通优化、个性化驾驶辅助及车辆资源共享等场景中的应用
-
港口集装箱箱号如何实现高精度自动识别?
在现代化港口和物流管理中,集装箱箱号的快速、准确识别是提升作业效率的关键环节。传统人工记录方式效率低、易出错,而孚为智能推出的高清集装箱号码自动识别系统,通过先进的OCR技术和智能图像分析,实现了箱号的全自动采集与数字化管理,为港口自动化升级提供了核心技术支持
-
rfid技术是如何应用在集装箱自动识别的呢?
在集装箱物流管理中,快速、准确地识别集装箱号码是提升港口、堆场和海关效率的关键。孚为智能将RFID(射频识别)技术与高清OCR识别系统相结合,进一步优化了集装箱自动识别的可靠性和自动化水平,为行业提供了更高效的解决方案
-
人形机器人周报 | 4月16日:多家人形机器人公司拓展应用场景
芝能科技出品 本周机器人行业热点频出,在产品展示、企业合作、技术标准以及市场布局等多个维度取得显著进展。各大企业积极推进人形机器人相关项目,从技术研发到应用场景拓展,均展现出强劲的发展势头。
-
场景深挖与价值升维:AI大模型商业化突围的破局点
站在2025年人工智能的"奇点时刻",当通用大模型以不可阻挡之势重构各行各业,大华股份交出的这份"智能答卷"不仅是一家企业的技术宣言,更是整个智慧物联行业向认知智能跃迁的缩影。作为深耕视频物联领域二十
-
AWE具身智能双轨并行:人形机器人成“打卡点”,非人形“卷”场景验证
当人形机器人和非人形具身智能均剑指家庭场景时,其并非零和博弈,而是共同指向具身智能的终极目标,通过物理世界与数字世界的深度融合,构建“人-机-环境”和谐共生的新生态
-
Gork-3语音功能上线!马斯克揭秘百天搭建超算中心
作者|Cora 编辑|Evan Gork-3背后,是马斯克资源整合能力的展现。今天,由xAI开发的Grok APP推出了实时语音模式,共支持10种模式,用户可通过语音与AI对话甚至电话式沟通,进一步提升Grok系列大模型信息交互体验
-
2025 搜索牌桌“大小王”:内容接管决策场景,AI 颠覆使用习惯
每逢互联网浪涌,搜索总是最先被革命的对象。1998 年谷歌用 PageRank 冲击了雅虎的人工目录,自此 PC 时代的信息中枢被搜索引擎定义。作为用户需求的最高频入口,搜索自然成为了技术迭代的第一试验场
-
拔得“工业AI应用场景创新奖”头筹,格创东智工业质检实力接连“登顶”
日前,国内最具影响力的工业软件领域赛事之一第四届工业软件创新应用大赛(人工智能+方向)总决赛完美落幕,格创东智工控智检事业部携手TCL华星、TCL工业研究院团队,凭借《多模态AI驱动的天枢平台,赋能高精度工业质检智能解决方案》这一卓越项目,荣获工业AI应用场景创新奖一等奖
格创东智 2025-01-17 -
OpenAI押注,这家语音AI初创如何扛起10亿美元估值?
作者|Lexie,编辑|Lu “AI赋能教育,颠覆学习体验。” 高效学习一门新语言是许多人心中的梦想技能,然而现实是即使多邻国打卡了上千天,实际对话时还是会词穷,因为大多数的语言学习从阅读和写作开始,而母语者是从听和说开始掌握语言的
-
人民邮电报|格创东智何军:深挖工业场景,在使用侧加速AI革新与应用赋能
提及格创东智,“工业AI”已成为最高频的词汇。11月19至21日,格创东智携“工业AI”亮相2024中国5G+工业互联网大会,以“AI驱动工业 数智赋能制造”为题,将工业AI探索之路形成一个缩影对外展示
-
AR独角兽Rokid困局:生态、内容和场景都得补
Rokid正在将战略从单一、垂直的AR赛道向AI+AR赛道转移,两条腿走路的Rokid看起来更稳当了,但其在生态布局、内容供给和落地场景方面,都存在不同程度的缺位问题。 文|叶之庭 创业十
-
为什么说MEMS-OXC在智算场景没有未来?
智算中心是这一轮科技革命的算力“心脏”,更是国际科技博弈的长期焦点。智算中心建设方案,一直牵动着国人的神经。 近期,OXC光交换技术在智算场景的应用,走进了大众视野,这个
-
灵宝CASBOT首款人形机器人产品—CASBOT 01发布,通用类脑智能机器人瞄准多场景落地
2024年11月13日,人形机器人品牌灵宝CASBOT正式发布首款全尺寸双足人形机器人“CASBOT 01”,一款多场景落地的通用类脑智能机器人。这是灵宝CASBOT在成立不到1年的时间内交出的一份亮眼的答卷,也标志着人形机器人赛道迎来一位极具快速商业化能力的新入局者
灵宝CASBOT 2024-11-14 -
OpenAI语音转写工具被曝严重缺陷:凭空捏造大段虚假内容
快科技10月28日消息,据报道,OpenAI旗下的AI语音转写工具Whisper被曝存在严重缺陷,竟会无中生有地创造大段乃至整句的虚假信息,这一消息引起了广泛关注。 尤为引人注目的是,有医疗机构公开承认采用了Whisper来记录医生与患者间的会诊内容,此举迅速在网络上掀起了轩然大波
-
-
9.11和9.9大模型全错,场景将成AI搜索护城河
前言: 根据全球研究与咨询公司Gartner于今年2月发布的报告预测,至2026年,传统搜索引擎的搜索量预计将下降25%。 此预测凸显了随着生成式人工智能技术的不断发展,人们的搜索习惯正在发生显著变化,进而推动了AI搜索领域的快速进步
-
大模型2024规模化场景涌现,加速云计算走出第二增长曲线
如果说“百模大战”是2023年国内AI产业的关键词,那么2024年我们将正式迈进“应用为王”的新阶段。 不少业内观点认为,2024年“百模大战”将逐渐收敛甚至洗牌,而大模型在千行万业的应用将从小规模试水,逐渐走向规模化落地
-
AI如何改变通信?一文了解5G与AI融合的必要性、融合方式及应用场景
作者:王飞鹏物联网智库 原创 随着5G商用落地,临近不惑之年的移动通信技术与过了甲子之年的人工智能技术,从独立演进开始走向深度融合发展。 “5G+AI”已经被业界视为一组最
-
劢微机器人「微蜂X20S」,无损兼容田字托盘,五大应用场景剖析,比你想象更出色
今年9月,劢微机器人隆重推出新品「微蜂X20S」,全球首发,独有专利,真正意义上无损兼容田字托盘的托盘式无人叉车,弥补市场空白。该车型支持田字托盘、川字托盘、九脚托盘在内的各种托盘配置,大幅提升托盘车适用场景。
劢微机器人 2023-11-22 -
使用 CNN 进行面部情绪识别
面部表情是人类之间交流的重要方式。 在人工智能研究中,深度学习技术已成为增强人机交互的强大工具。心理学中面部表情和情绪的分析和评估涉及评估预测个人或群体情绪的决定。 本研究旨在开发一种能够使用卷积神经网络(CNN)算法和特征提取技术预测和分类面部情绪的系统
-
大模型赛道正“热”:卷场景、卷芯片、卷人才
作者|孙鹏越 编辑|大 风 比五一假期还要火热的,只有大模型赛道了。 ChatGPT、AIGC、算力、云计算、人工智能……只要与这几个关键词挂钩,就能堂而皇之均冠以“大模型”之名,资本为之侧目,股价随之而涨
-
大模型时代进入尾声:场景式模型接棒
文/彭艺信 编辑/侯煜 ChatGPT像里科技行业里的鲇鱼,搅动一池春水。自从它出现之后,中国科技企业扎堆发布AI大模型。 有人嘲讽,ChatGPT在中国即将“亩产过万&rdqu
AI大模型 2023-04-20 -
新一代AI带来更大想象空间!上海将打造元宇宙超级场景
来源 | 零壹财经 “今年我们联合相关部门,着力打造元宇宙超级场景”。 据东方网报道,上海市经信委主任吴金城4月12日在“20
-
引领混合办公新时代,联想thinkplus强势推出一栈式混合办公全场景方案
3月22日,联想thinkplus在北京举办一栈式混合办公全场景方案发布会。联想重磅发布以thinkplus会议平板S+系列领衔的多款高效办公新品,旨在为企业客户和职场人士塑造智慧办公会议新体验,开启“混合办公新视界”
-
ChatGPT走俏:车载语音交互“驶”向风口
文:谈擎说AI 作者:郑开车去年11月,ChatGPT横空出世,短短几个月就成为现象级应用软件。和“什么都能往里装”的元宇宙相比,这款聊天机器人似乎更接地气、更有实用价值。ChatGPT上线后,很多用户怀揣好奇心与其对话,其对很多宏大问题给出的答复着实令人称叹
-
使用 OpenCV-SeventhSense SOTA 模型进行人脸识别
OpenCV 最近发布了与 SeventhSense 合作的人脸识别 SDK。它是 NIST 人脸识别挑战赛(2022 年 3 月)的前 10 名模型,速度极快且无需 GPU。在 opencv-seventhsense FR webapp 中,你可以创建一个集合并将组织中的人员聚合到组中
-
使用 TensorFlow Lite 在 Android 上进行印地语字符识别
介绍如果你曾经想构建一个用于文本识别的图像分类器,我假设你可能已经从 TensorFlow 的官方示例中实现了经典的手写数字识别应用程序 。该程序通常被称为计算机视觉的“Hello World”,它是 ML 初学者构建分类器应用程序的一个很好的起点
-
-
专利看腾讯声纹识别技术有进步吗,声音解锁功能不再鸡肋!
知情郎·眼|侃透公司专利事儿今天聊声纹识别。即如何鉴伪声音。顾名思义,即通过声音来识别出来“谁在说话”,是根据语音信号中的说话人个性信息来识别说话人身份的一项生物特征识别技术。微信也有类似声纹解锁功能
-
为场景找技术,华为创新基础设施助力行业数字化转型
[泰国,曼谷,2022年9月20日] 华为全联接大会2022在泰国曼谷举行期间,业界嘉宾围绕“创新数字基础设施,释放数字生产力”主题进行探讨,以“为场景找技术”为关键途径,分析数字化浪潮下各行各业面临的数字化转型难题,并结合华为技术优势提出建议,共同探寻行业数字化发展方向和机遇
-
用机器学习识别排球比赛的阶段
排球比赛的阶段用人工智能分析排球比赛有多种方法。我过去常常跟踪球,以便将比赛时间从整个视频中分离出来。另一种方法是确定游戏阶段,并根据阶段流程做出决策。让我们假设排球比赛包括4个阶段:· 没有开始。没有人或少数人在场上徘徊
机器学习 2022-09-13 -
用场景定义硬件,英码科技破解“边缘计算”密码
云侧还是边侧,AI下的时代命题!2022年8月6日,“以边缘的力量”为主题的全球边缘计算大会在深圳成功召开,本次大会由边缘计算社区主办。作为边缘计算领域的技术盛会,本次大会齐聚各大企业、高校的技术专家
-
Ai落地场景增多带动相关就业,人工智能相关岗位备受脉脉网友看好
在7月底,由中国互联网协会发起的人工智能领域峰会——2022新智者大会汇聚了众多人工领域的专家、学者,这场盛会通过主题演讲、圆桌对话的形式向大众科普了人工智能领域在未来的发展趋势以及其价值含量,让更多普通人深入了解到了Ai技术在将来的落地场景,将会带动相关就业增加,进一步融入大众的日常生活
-
银行需要搭建智能客服模块的中台能力,驱动全场景智能客服务升级
易观分析:虽然客户服务有着将近20年的发展历史,相对于人工客服,客户体验依然较差。银行应用智能客服系统时,存在二次开发成本高、厂商的解决方案不能够很好地适配银行场景等问题。银行需要形成智能客服相关的可复用于跨部门的中台能力
-
开放平台,定制开发,temi机器人实现多场景适配
长期来看,中国人口老龄化、劳动年龄人口数量减少等问题持续升温,劳动力市场成本逐渐攀升或将成为难以避免的大趋势,如何提高效率和降低用人成本将是企业面临的一大问题。服务机器人的出现逐步替代人们普遍不愿意从事的程序化、重复性的简单劳动岗位,并提高服务业运转效率,从而降低劳动力成本
-
MIT最新AI面部识别研究:AR技术协助情绪侦测
“自闭症成人的感知神经连接可能是“嘈杂的”(noisy)或低效的。”作者:Claire编辑:tuya出品:财经涂鸦(ID:caijingtuya)对大部分健康的人来说,识别人脸上表达的情绪很容易。微笑可能意味着幸福,而皱眉可能意味着愤怒,但自闭症患者在完成这项任务时有很大的困难
-
全场景阅读体验再升级,华为阅读8种情感人声全新上线
阅读是人们认识世界的一扇天窗。但随着时间的碎片化,传统阅读所受到的限制越来越多。如何解放双手,做到真正的畅享阅读? 华为阅读推出最新情感语音功能,在华为多终端同时上线8种音色的情感人声,充盈阅读新生态,为用户带来更加优质的情感阅读体验
华为 2022-06-22 -
使用Python的人脸识别系统
介绍人脸识别不同于人脸检测。在人脸检测中,我们只检测了人脸的位置,在人脸识别任务中,我们识别了人的身份。在本文中,我们将在人脸识别库的帮助下,使用python构建一个人脸识别系统。市场上有许多用于人脸识别的算法
-
智慧眼CTO谭松波:深耕长尾应用场景,做人工智能工匠
数字经济浪潮下,人工智能作为技术驱动力量高速运行,迎来了黄金时代,各路资本纷至沓来。华为、百度、腾讯、阿里等科技巨头投入重金拓展AI边界,人工智能企业的IPO步伐也在提速,其中科大讯飞、商汤、云从等企业已成功上市
AI 2022-05-24