视觉语言导航
-
赋予大模型“眼睛”:视觉语言模型带来全新的可能
芝能智芯出品 视觉语言模型(VLM)正成为人工智能发展的关键节点。通过将大语言模型(LLM)与视觉编码器相结合,VLM 不再局限于传统计算机视觉的封闭任务框架,而是能以自然语言为接口,对图像、视频和文本进行深度理解和灵活生成
-
迈向人类级驾驶智能:VLA视觉语言的行动模型
芝能科技出品2025年,由于安全和强监管的作用,辅助驾驶行业正处于黎明前的黑暗。面对复杂的现实路况、多样的人类行为模式,以及传统AI在泛化和理解能力上的瓶颈,理想汽车在《AI Talk第二季》系统性的阐述了“VLA(视觉语言行动模型)”
-
嵌入式视觉,规模化部署与多模态技术进步正驱动产业变革
芝能智芯出品嵌入式人工智能与视觉技术正站在从概念验证走向大规模应用的关键拐点上,2025年嵌入式视觉峰会给大家带来很多的启发。当前两大关键趋势:◎ 其一是嵌入式视觉系统与人工智能从实验室原型
-
聊聊MoA(混合智能体架构):如何激发LLM潜力并掀起语言模型协作革命?
全文约 3500 字,预计阅读时间约 9 分钟 近年来,大型语言模型(LLMs)在自然语言处理领域掀起了一场风暴,从对话生成到复杂任务推理,它们的表现令人惊叹。然而,单个模型的性能总有瓶颈,训练成本高昂且资源需求巨大
-
高速数据传输:构建嵌入式视觉的未来
市场对高速数据传输的需求正迅速增长。随着智能设备、数据中心系统和软件的发展,企业需要数据在其技术基础设施中快速传输的同时保持适应性、可扩展性和安全性。实时数据传输给系统带来了更大的压力,对基础设施提出了更高的要求
莱迪思 2025-04-23 -
解码 | 研华嵌入式核心优势,以Edge Al驱动机器视觉升级
随着生成式AI的不断演进,AI 在各行各业逐渐展露出巨大潜能。由于 AI 技术的普及在很大程度上依赖于云端大型服务器和高性能算力,这一定程度上限制了 AI 应用的广度与深度。“工业现场对于稳定性、实时性的要求很高,因此企业不可能将现场全部搬到云上
研华科技 2025-04-18 -
AI视觉芯片在智慧安防领域应用潜力巨大 2024年我国销售额同比增长超过20%
国科微正在积极推进边缘AI芯片产品的研发工作,其推出的4K AI视觉处理芯片具备功耗低、延时率低、画质清晰等优势。 AI视觉芯片,又称人工智能视觉芯片,指能够高效执行算法的视觉芯片。AI
-
大语言模型火爆的今天,我们为什么还要拥抱世界模型?
图灵奖得主杨立昆认为,目前AI界持续追捧的大语言模型并非十全十美,它隐藏着四个难以突破的致命弱点:一是理解物理世界,二是拥有持久记忆,三是具备推理能力,四是复杂规划能力。 而能够克服第一个“致命弱点”的技术,叫作世界模型
-
AI语言学习应用Speak投资人谈投资AI应用:看到toB和toC融合的机会
“Accel主要支持那些为用户带来5到10倍体验提升的产品及其团队。” 作者:罗宾编辑:tuya出品:财经涂鸦(ID:caijingtuya) 《财经涂鸦》获悉,近日,
-
从边缘端到中心端,海康威视视觉大模型落地交通行业
近日,海康威视视觉大模型在交通场景落地。依托观澜大模型,突破传统算法瓶颈,海康威视在端侧发布新一代事件检测系列摄像机,并在中心端同步部署大模型能力推出事件检测终端、事件检测服务器。从边缘端到中心端大模型,带来智能应用的性能和效果提升,推动交通行业智慧升级
海康威视 2025-03-06 -
视觉大模型落地应用,海康威视发布系列大模型摄像机
进入2025年,依托海康观澜大模型技术体系,海康威视将大模型能力直接部署至端侧,推出一系列视觉大模型摄像机。视觉大模型摄像机不仅成像画质更优,更重要的是突破了场景普适性弱、复杂目标识别难等瓶颈,进一步提升目标检出率,大幅降低误报,在零样本的情况下也能进行识别,检测目标种类更丰富
海康威视 2025-03-05 -
自动驾驶中大受追捧的纯视觉方案到底有何优势?
自动驾驶技术是汽车产业智能化转型的重要方向,也是全球科技企业和传统车企竞相角逐的技术高地。在实现自动驾驶的技术上,感知系统作为自动驾驶汽车的“眼睛”,决定了其对环境的理解能力。感知系统的发展路径大致分为两类:激光雷达主导的多传感器融合方案和完全依赖摄像头的纯视觉方案
-
AI视觉,谁是盈利最强企业?
豆包大模型团队发布视频生成实验模型“VideoWorld”最新成果,可仅靠视觉认知世界。不同于Sora、DALL-E、Midjourney等主流多模态模型,VideoWorld在业界首次实现无需依赖语言模型
-
豆包视觉理解模型低价上新,大模型竞争进入价格战阶段?
(本文系紫金财经原创稿件,转载请注明来源)字节跳动再次把大模型的价格打了下来!在12月18日举办的火山引擎 Force 大会上,字节跳动正式发布豆包视觉理解模型,为企业提供更具性价比的多模态大模型能力
-
机构看衰专家批评项目艰难,大语言模型会不会成为即将破碎的AI泡沫?
大语言模型不再被视作通往AGI的桥梁,生成式AI未来的发展方向在哪里? 已经烧掉5000亿美元还要继续耗费资源的大语言模型,后面的路还走得动吗? 烧钱、耗费资源、难以盈利,被持续唱衰的大语
-
宝马、丰田背后的秘密武器!AI视觉如何完美控制质量?
当下智能汽车的自动驾驶技术再一次陷入激光雷达和纯视觉方案的争论,虽然目标都是为了实现汽车的无人驾驶,但其背后的逻辑却是千差万别的。 在汽车工厂中,各类传感器是汽车工厂自动化的重要载体
-
【展商推荐】康耐视Cognex:深耕智能机器视觉
【展商推荐】康耐视Cognex:深耕智能机器视觉【Cognex】即将亮相全数会 2024电子元器件展览会展位号:8B23unsetunset康耐视视觉检测系统(上海)有限公司unsetunset康耐视
康耐视 2024-08-20 -
解锁边缘AI“新视野”:事件视觉如何助力工业制造释放新质生产力?
在智能工厂里,AGV/ARM机器人通过三维视觉感知,精准识别并拾取货架上的物品,它们还可以与人类同事进行协同互动,安全将货物送至生产车间。生产线上,配备智能摄像头的机器如同拥有智慧的眼睛,可以读取标签和解释标识
-
奥比中光定增合规性惹争议 布局3D视觉竞争力如何
《投资者网》丁琬璎 今年以来,人形机器人概念在二级市场上走红,奥比中光科技集团股份有限公司(以下简称“奥比中光”,688322.SH)作为视觉环节的主要上市公司之一也受到关注
奥比中光 2023-12-28 -
技术创新:苹果在闪存上存储大型语言模型(LLM)引领未来AI发展
(本篇文篇章共1135字,阅读时间约1分钟) 2023年12月22日,据多家媒体报道,苹果正积极探索在闪存上存储大型语言模型(LLM)的技术创新,并计划将其引入iPhone、iPad和Mac等设备,以在资源有限的环境中提高人工智能(AI)的运行效率
-
-
年度词汇公布,AI正在“入侵”人类语言
2023年,除了AI还没有一个词能达到这种全民皆知的程度。几乎人人都在说AI,人人都在用AI。而现在,有关“人工智能”的词汇,已经入选了全球各大词典的“年度词汇”。有哪些人工智能相关的词,有幸当选年度词汇呢?我们一起来看下
-
图漾科技:专注产品精研,推动3D机器视觉大规模普及化应用
OFweek维科网特别邀请国内专业3D机器视觉软硬件企业—图漾科技销售副总裁 王坦先生接受采访,由他为我们介绍来自图漾科技在3D机器视觉领域的深度服务经验与市场布局。
-
业绩亏损股价暴跌,科大讯飞的问题是幕后推手,还是大语言模型?
10月最后一个交易日,科大讯飞股价刷新今年下半年新低纪录。自10月24日因科大讯飞学习机存在“扭曲历史等违背主流价值观内容”的事件发酵,导致其星火认知大模型V3.0发布会结束后,股价出现了大幅度暴跌。
-
虚拟现实改善视觉治疗的前景
本篇文章是致力于眼睛和改善视力恢复的系列文章的一部分,作者William A. Haseltine是一名科学家、商人、作家和慈善家,同时也是ACCESS Health International的创始人,这是一家致力于提供医疗健康创新解决方案的非营利性组织
-
-
AIGC 施展“物理魔法”,3D视觉突破“精度极限”
文|姚悦,编|王一粟 “没有艺术,全是物理!物理让你快乐,不是吗?” 近日,在世界计算机图形会议 SIGGRAPH 2023 上,英伟达创始人、CEO 黄仁勋宣布,
-
康耐视推出基于AI的嵌入式视觉系统以帮助生命科学设备制造商解决棘手应用
康耐视公司(纳斯达克:CGNX)宣布推出Advantage 182视觉系统,其经过专门设计,可使复杂的定位、分类和检测任务实现自动化。这款一体化视觉系统内置先进的机器视觉、代码读取和边缘学习技术,可自动执行多样的任务。
-
-
大语言模型,救不了“网络暴民”
语言可以杀人——网络时代,相信没人会否认这一点。 语言攻击,是最具代表性的网络暴力之一。谩骂刚失去儿子的母亲,诋毁女孩的粉色头发,嘲笑男性的气质“太娘&rdquo
-
机器视觉,谁是成长最快企业?
企业成长能力是随着市场环境的变化,企业资产规模、盈利能力、市场占有率持续增长的能力,反映了企业未来的发展前景。本文为企业价值系列之【成长能力】篇,共选取120家机器视觉企业作为研究样本,并以营收复合增长、扣非净利复合增长、经营净现金流复合增长等为评价指标
机器视觉 2023-06-30 -
AI+制造业:机器视觉开启掘金新大陆
前言: 机器视觉是AI的感知工具,五感中视觉获取的信息占比超过 80%,因此机器视觉将作为人工智能的底层工具而被反复调用。 今年机器视觉企业大规模新增
-
计算机视觉与物体检测
第一次通过Tensorflow对象检测API了解对象检测。它很容易使用。传入了一张海滩的图片,作为回报,API在它识别的对象上绘制了方框。这似乎很神奇。 很好奇,想剖析API,了解它到底是如何在幕后工作的
-
机器视觉公司,在玩一局玩不起的游戏
有个著名咨询公司曾经预测过:未来只有两种公司,有人工智能的和不赚钱的。 它可能没想到,还有第三种——不赚钱的AI公司。 去年我们报道过“正在消失的机器视觉公司&
-
机器视觉,谁是盈利最强企业?
企业盈利能力是指企业获取利润的能力,通常表现为一定时期内企业收益数额的多少及其水平的高低。盈利能力的分析,就是对公司利润率的深层次分析。本文为企业价值系列之【盈利能力】篇,共选取89家机器视觉企业作为研究样本
机器视觉 2023-04-11 -
通过实际示例学习计算机视觉和机器学习的基本技术
OpenCV 是一个开源的计算机视觉库,广泛应用于计算机视觉和机器学习领域。它提供了广泛的图像和视频处理工具,包括特征检测、图像识别和对象跟踪。 在本文中,我们将了解如何使用 OpenCV 执行各种任务,重点是如何使用它来应用机器学习
-
用AI回忆起曾被忘却的语言
语言是文明的DNA,然而联合国教科文组织调查数据显示,全球有七千多种有记录的语言,超过400种濒危,两千种极危。中国语言种类繁多,目前有130 多种语言,有25种语言使用人口已不足千人。 以前的少数
-
或许,更多的机会在于中国的大语言模型生态
相信这两天,很多人都注意到了这样一条新闻:苹果公司上周阻止了一款使用ChatGPT功能的电邮应用的更新,因为担心其可能生成不适合青少年儿童的内容。除了苹果之外,还有许多美国科技圈大佬表达了对ChatGPT生成内容的担忧
-
2023 最新计算机视觉学习路线(入门篇)
计算机视觉是人工智能的一个领域,专注于教计算机解释和理解视觉世界。它涉及使用算法、深度学习模型和其他技术使机器能够识别图像或视频中的对象。计算机视觉可用于各种任务,如面部识别、目标检测、图像分割、运动估计和跟踪等
-
分析计算机视觉模型的性能
最近了解了一个令人难以置信的工具,叫做Voxel51的FiftyOne,无法推荐它足够用于你的工作或研究。在文中,将解释如何使用该工具进行图像分类。介绍FiftyOne是一个开源工具,为数据集标记和计算机视觉模型分析提供了强大的图形界面
计算机视觉 2023-02-06
最新活动更多 >
-
6月13日立即参评>> 【评选】维科杯·OFweek2025中国工业自动化及数字化评选
-
6月13日立即参评>> 【评选启动】维科杯·OFweek 汽车行业年度评选
-
6月13日立即参评 >> 【评选启动】维科杯·OFweek 人工智能行业年度评选
-
即日-6.18立即报名>> 【在线会议】英飞凌OBC解决方案——解锁未来的钥匙
-
6月19日立即报名>> 【在线研讨会】安世汽车车身照明方案
-
6月20日立即下载>> 【白皮书】精准测量 安全高效——福禄克光伏行业解决方案