大家好,这里是人工智能最前沿。OCR 赛道悄悄展开了一个机会。DeepSeek 官方已经正式开源了「DeepSeek-OCR」,并宣布已原生支持 vLLM 推理框架。这意味着:企业现在可以 本地化部署一款高质量视觉大模型,不依赖第三方 ...
在第三方评测机构Artificial Analysis的测试中,Minimax M2以61分获得了开源模型第一,紧随Claude 4.5 Sonnet。 而且经济高效,推理速度是Claude 3.5 Sonnet的两倍,API价格却只有8%。
过去,AI 只能“被训练”;现在,它开始“训练自己”。来自 LSTM 之父 Jürgen Schmidhuber 团队的最新研究,展示了一种能 自我修改、 自我修复、甚至 自我优化的智能体——它真的开始学会 Debug 自己。
编辑 | Eino 项目组当大语言模型突破了 “理解与生成” 的瓶颈,Agent 迅速成为 AI 落地的主流形态。从智能客服到自动化办公,几乎所有场景都需要 Agent 来承接 LLM ...
具体来说是Microsoft 365 Copilot中的Researcher智能体,新增了“计算机使用”(Computer Use)的能力,可以生成更智能的研究、更深入的洞察和更全面的报告。 在GAIA和BrowseComp基准测试 Researcher with Computer Use进行了评估,这些基准测试衡量AI系统在开放网络上进行推理、搜索和综合信息的能力。
Vercel 在今年的 Ship AI 2025 活动中公布了多项 AI 开发工具更新。大会内容涉及主题演讲和多场围绕 AI 工作流、智能代理及可观测性的技术分享。 其中最受关注的是 AI SDK 6 的测试版。这一版本新增了智能代理抽象层,让开发者可以在项目中统一定义并复用 AI 代理的行为。开发者只需定义一次代理逻辑,就能在应用的不同部分调用。SDK ...
在第三方评测机构Artificial Analysis的测试中,MiniMax M2以61分获得了开源模型第一,紧随Claude 4.5 Sonnet。