AI快讯Ilya公司融资10亿美元千问手写OCR准确率100AlphaFold3开源实现

shadowrocket • 2026年2月20日 am8:05 • Shadowrocket官网

🤖 OpenAI联合创始人Sutskever新创公司SSI获10亿美元融资

📝 Qwen2-VL-7B 模型在手写文档OCR任务中达到100%准确率

🧬 Ligo Biosciences 开源 AlphaFold3 实现

🧠 AI研究团队发布开源混合专家大语言模型OLMoE

🚀 Anthropic推出Claude企业版，集成GitHub并扩展上下文窗口

🍯 19岁MIT辍学生创业项目Honeycomb在SWE-Bench测试中击败亚马逊

💰 OpenAI API定价策略引发开发者困惑

🐍 DeepLearning.AI 推出 AI Python 入门课程完整系列

🖥️ Elon Musk在超级计算集群方面领先优势明显

🤖 推测称 AGI 已在去年底实现，但受限于成本和效率

🧠 Groq 扩展 GroqCloud 支持多模态 AI

🖥️ Figma副总裁推荐设计师尝试AI编程工具

🏆 Scale AI 更新SEAL人工智能模型评测榜单

🤖 GitHub 推出 AI 辅助代码审查 Chrome 扩展 PR-Agent

🌡️ Google AI 推出新型热弹性工具助力城市降温

①👉OpenAI联合创始人Sutskever新创公司SSI获10亿美元融资

AI安全公司SSI宣布完成10亿美元融资，投资方包括NFDG、a16z、红杉资本、DST Global和SV Angel。SSI由OpenAI联合创始人Ilya Sutskever创立，致力于开发安全的超级人工智能。

公司官方表示，SSI正在打造一条通往安全超级人工智能的直接路径。目前公司正在招聘人才，有意者可通过官网了解详情。

路透社报道提供了更多关于SSI的信息。该公司聚焦于AI安全领域，旨在确保未来更强大的AI系统能够安全可控地发展。

业内人士认为，随着AI技术的快速发展，越来越多的AI实验室可能会采取开放权重、开源或开放科学的路线。这一趋势反映了行业对AI透明度和安全性的日益重视。

②👉Qwen2-VL-7B 模型在手写文档OCR任务中达到100%准确率

据Twitter用户Dylan Freedman报告，阿里巴巴开源的Qwen2-VL-7B Instruct模型在手写文档文本提取任务中取得了100%的准确率。

Freedman表示，这是他见过的第一个在OCR（光学字符识别）任务中如此精准的开源权重模型。Qwen2-VL-7B Instruct模型采用Apache 2.0许可证发布。

该模型展示了人工智能在文本识别领域的重大进展，特别是在处理手写文档方面。这一突破可能对文档数字化、历史文献研究等领域产生深远影响。

Qwen2-VL-7B Instruct模型目前可在Hugging Face平台上访问和使用。

③👉Ligo Biosciences 开源 AlphaFold3 实现

Ligo Biosciences 的 CTO Arda Göreci 宣布，该公司已开发出 DeepMind 前沿模型 AlphaFold3 的开源实现。这一项目历时 8 周，主要特点包括：

基于 PyTorch 构建，具有高效的内存使用和运行速度

采用 Apache 2.0 许可证

在实现过程中发现并解决了原始伪代码中的多处不一致问题

该团队还与 Adaptyv Bio 合作，将 ProteinFlow 扩展到配体、多聚体和核酸领域。此外，他们还与 Basecamp Research 建立了合作伙伴关系，以获取高质量的序列数据。

Göreci 表示，该模型在 8 块 A100 GPU 上训练 10 小时后，即可生成蛋白质结构的动画效果。目前，团队正在开发更具可扩展性和效率的实现版本。

该项目的代码已在 GitHub 上公开，并开放了 beta 测试注册。

④👉AI研究团队发布开源混合专家大语言模型OLMoE

AI研究团队发布了名为OLMoE的开源混合专家大语言模型。该模型具有以下特点：

OLMoE是首个完全开源的高性能混合专家大语言模型，拥有10亿活跃参数和70亿总参数，经过5万亿token的训练。

性能方面，OLMoE在小型语言模型中表现最佳，可与Gemma、Llama等更昂贵的模型相媲美。它超越了许多更大的模型，如DeepSeek、Llama2和Qwen-Chat。

效率方面，相比OLMo 7B，OLMoE的训练FLOP减少了4倍以上，每次前向传播使用的参数减少了5倍以上，实现了更低成本的训练和推理。

研究人员还进行了一系列实验，包括专家粒度、路由方法、共享专家等，并对模型进行了详细分析，发现可能存在领域特化和token ID特化现象。

该项目完全开源，包括模型、数据、代码和日志，为进一步的混合专家模型研究提供了宝贵资源。

⑤👉Anthropic推出Claude企业版，集成GitHub并扩展上下文窗口

Anthropic公司宣布推出Claude企业版，为组织提供安全协作的AI助手服务。新版本具有以下关键特性：

扩展上下文窗口 Claude企业版将上下文窗口扩展至50万个token，大幅提升了处理长文本的能力。

原生GitHub集成首次引入原生GitHub集成功能，目前处于测试阶段，仅向部分早期企业用户开放。Anthropic计划在今年晚些时候向更多用户推广这一功能。

企业级安全 Claude企业版配备了企业级安全功能，确保组织数据的安全性。

无需训练即可使用新版本无需对聊天记录或文件进行额外训练，便可直接使用，提高了部署效率。

Anthropic表示，GitHub集成只是其计划中的第一个原生集成功能，未来将连接Claude与更多重要数据源。

⑥👉19岁MIT辍学生创业项目Honeycomb在SWE-Bench测试中击败亚马逊

Honeycomb，一家由19岁MIT辍学生创立的AI初创公司，在软件工程能力基准测试SWE-Bench中取得了22.06%的得分，超越了亚马逊Q和Anthropic的Devin模型。

Honeycomb由Andrew Liu和Ishank Arora创立，两人都是数学和物理奥林匹克竞赛的顶尖选手。他们开发的AI编程助手已经成为一个完整的产品：

集成了Github、Slack、Jira等工具

可以根据Jira工单提交Github PR

能够编写任何语言的代码，包括跨语言的全栈Web应用

Honeycomb采用了多个专门的AI代理，分别用于修复bug、开发新功能、重构代码和代码审查等任务。该团队表示，使用Honeycomb显著提高了他们的开发效率，尤其是在夜间自动编码方面。

技术方面，Honeycomb团队分享了一些独特的方法：

使用专门的代理处理代码缩进问题

允许AI长时间解决复杂问题，最长可达一小时

每个补丁平均使用260万个token，远超人类程序员

Honeycomb目前处于等待名单阶段，但正在努力尽快向更多用户开放。

⑦👉OpenAI API定价策略引发开发者困惑

OpenAI的API定价策略引发了开发者的困惑。一名开发者在社交媒体上表示，刚刚发现OpenAI的'chatgpt-4o-latest'端点的价格是最新gpt-4o模型的两倍。

这位开发者对不同模型的价格差异和使用场景表示疑惑，提出了以下问题：

'gpt-4o-2024-08-06'模型是否性能较差？

ChatGPT是否有更好的模型？

为什么存在价格差异？

何时应该使用哪种模型？

另一位开发者回应称，ChatGPT-latest模型的推出是为了满足开发者对最新聊天模型对等性的需求。这一解释表明，OpenAI正在努力平衡不同用户群体的需求，同时也凸显了AI模型定价和功能差异化的复杂性。

⑧👉DeepLearning.AI 推出 AI Python 入门课程完整系列

DeepLearning.AI 宣布发布 AI Python 入门课程系列的最后两门课程。至此，这个由四门课程组成的完整系列已全部上线，并在限时内免费开放。

该系列课程的设计理念突出两个重点：

教授如何使用 AI 辅助编写代码，顺应行业发展趋势

利用生成式 AI 技术，快速实现代码的实用价值

Andrew Ng 表示，AI 技术的发展使得现在是学习编程的绝佳时机。他鼓励有意学习编程的人或其身边的朋友考虑参与这些课程。

课程详情可在 DeepLearning.AI 官网的短期课程页面查看。

⑨👉Elon Musk在超级计算集群方面领先优势明显

Abacus AI 公司 CEO Bindu Reddy 近日在社交平台发文，对 Elon Musk 在复杂系统构建方面的能力给予高度评价。

Reddy 表示，无论人们对 Musk 有何看法，他在这类复杂系统构建方面都是世界顶尖的。她特别指出，就超级智能相关的超级计算集群而言，Musk 始终处于领先地位。

Reddy 还附上了一张图片，展示了一个大型计算机集群设施。这暗示了 Musk 旗下公司在高性能计算基础设施方面的投入。

这一评论凸显了在人工智能快速发展的背景下，高性能计算能力对于推进超级智能研究的重要性，以及 Musk 在这一领域的优势地位。

⑩👉推测称 AGI 已在去年底实现，但受限于成本和效率

有观点认为通用人工智能（AGI）可能已在去年底实现，但目前存在一些限制因素：

速度缓慢：现有的AGI系统运行速度较慢，无法满足实际应用需求。

成本昂贵：维护和运行AGI系统的成本较高，限制了其广泛应用。

能力过强：AGI的能力可能超出预期，引发安全和控制方面的担忧。

该观点预测，公众可能要到明年底才能看到AGI的一些成果。至于普通用户获得AGI访问权限的时间，则可能遥遥无期。

这一推测引发了对AGI发展进程、应用前景以及技术垄断等问题的讨论。然而，目前尚无官方或权威机构对AGI是否已实现做出确认。

⑪👉Groq 扩展 GroqCloud 支持多模态 AI

Groq Inc 宣布扩展其 GroqCloud 服务，现已支持图像、音频和文本处理。通过整合 LLaVA v1.5 7B 模型，开发者和企业可以充分利用多模态 AI 的潜力，创建结合视觉、听觉和文本输入的创新应用。

GroqCloud 的这一扩展将为用户提供更全面的 AI 解决方案，使其能够处理和分析多种类型的数据。这一进展有望推动各行各业开发更加复杂和智能的应用程序，从而提高生产效率和创新能力。

Groq Inc 表示，有关此次扩展的详细信息可在其官方网站上查阅。此举动凸显了 Groq 在 AI 技术领域不断创新和拓展的努力，以及其在满足市场对多模态 AI 解决方案日益增长需求方面的战略布局。

⑫👉Figma副总裁推荐设计师尝试AI编程工具

Figma设计副总裁Noah Levin在社交媒体上表示，他正在深入使用Cursor.ai和Anthropic的Claude Artifacts等AI编程工具，并强烈推荐设计师们尝试这些新工具。

Noah Levin认为，这些AI工具能够：

将设计师从平均水平以下的程序员提升到可接受水平

快速解决编程障碍

非常适合快速原型设计概念

他还特别提到，这些工具在制作庆祝他人的小型网站时非常有用。Noah Levin表示，使用这些世界级的编程助手是一种非常有趣的体验。

⑬👉Scale AI 更新SEAL人工智能模型评测榜单

Scale AI CEO Alexandr Wang宣布更新了SEAL人工智能模型评测榜单，新增了三个模型：

GPT-4o-latest (gpt-4o-2024-08-06)

Gemini 1.5 Pro (Aug 27, 2024) (gemini-1.5-pro-exp-0827)

Mistral Large 2 (mistral-large-2407)

评测结果显示，GPT-4o最新版本在数学和编码方面的表现有所提升，但在指令遵循和西班牙语方面略有下降。Gemini 1.5 Pro在所有榜单上都有进步，而Mistral Large 2则在所有榜单上超越了前代模型。

在编码能力方面，GPT-4o (August 2024)在代码正确性上表现最佳，但Claude在提示遵循方面更胜一筹。指令遵循方面，GPT-4 Turbo仍然是最具事实性的模型。

多语言能力测试中，所有模型在西班牙语指令遵循方面的表现都不如英语，显示多语言能力仍有提升空间。

Wang表示，由于数学榜单(GSM1K)已趋于饱和，Scale AI正在开发新的数学基准测试。未来几周内，他们还将添加Grok 2等更多模型的评测结果。

⑭👉GitHub 推出 AI 辅助代码审查 Chrome 扩展 PR-Agent

GitHub 新推出一款名为 PR-Agent 的 Chrome 扩展插件，旨在通过 AI 技术提升代码审查效率。该扩展为开源项目免费使用，集成了包括 Claude 3.5 Sonnet 和 GPT-4 在内的顶级代码模型。

PR-Agent 主要功能包括：

自动为代码提供文档、单元测试和改进建议

帮助开发者发现可能被忽视的 bug 和其他问题

生成 pull request 概述，简化审查流程

该扩展相当于在提交 pull request 时，有一位智能助手实时提供建议和支持。它将 AI 聊天功能直接集成到 GitHub 仓库中，使开发者能够在 pull request 页面上与 AI 进行交互。

PR-Agent 的推出标志着 AI 技术在软件开发领域的进一步应用，有望显著提高代码审查的效率和质量。

⑮👉Google AI 推出新型热弹性工具助力城市降温

Google AI 推出了一款新的热弹性工具，该工具利用人工智能技术分析卫星和航拍图像，帮助城市量化如何通过冷却干预措施降低地表温度。

这款工具可以评估诸如种植树木和在屋顶安装高反射表面等措施的效果。通过应用人工智能技术，城市规划者能够更精确地预测和实施降温策略。

Google AI 表示，这项技术的开发旨在应对日益严重的极端高温问题，为城市提供数据支持，以制定更有效的降温策略。这一工具的应用有望改善城市热岛效应，提高居民生活质量。

该工具的推出体现了人工智能在环境保护和城市规划领域的潜力，为应对气候变化带来的挑战提供了新的解决方案。

👇

受篇幅限制，下述 35条快讯可点击阅读原文查看详情。

🎙️ Meta AI 团队在 INTERSPEECH 2024 展示多项语音技术研究

🖥️ 英伟达展示AI PC在游戏和创作中的应用

🦾 Eric Jang 探讨机器人臂力控制原理

🕯️ AI先驱Laveen Kanal逝世，享年93岁

🤖 Abacus AI推出企业级自主AI代理系统

🤖 Google.org 提供1000万美元资助树莓派AI教育项目

🦠 AI助力解锁数百种病毒蛋白质结构

💻 Groq 称 LPU 能效比 GPU 高 10 倍

⚡ TensorFlow Lite 更名为 LiteRT，反映扩展能力

🧠 MIT CSAIL 纪念人工智能之父 John McCarthy 诞辰

🗣️ Groq发布语音AI助手构建教程

🎮 MarioVGG：

能生成超级马里奥游戏视频的AI模型

🚀 PyTorch Conference 展示 ExecuTorch 边缘部署新进展

📊 Tom Yeh 教授发布自注意力机制交互式电子表格

🤖 GlobalGPT推出多合一AI平台，集成多种顶级AI模型

📝 教师应对AI作业影响探索监控软件

🚀 You.com 融资5000万美元，推出AI生产力引擎

🌍 HuggingFace发布AI环境影响入门指南

📱 PaliGemma视觉语言模型在Android上实现

🌐 Google Chrome 开发者工具集成 Gemini Nano 模型

📚 语言建模会议COLM公布已接受论文并开放注册

💻 01.AI发布开源代码大模型Yi-Coder 1.5B和9B

🧮 PyTorch 展示使用 Triton 实现 LLM 模型 FP16 推理

🧠 人工智能专家对比RAG和微调技术

🤖 LangChain 推出 LangGraph.js 人机交互功能

💻 免费SQL函数调用网络研讨会即将举行

🎓 斯坦福大学推出AI公共服务教育项目

📊 LlamaIndex 与 Giskard AI 联合推出 RAG 评估指南

🔍 研究显示长上下文LLM难以替代RAG技术

🔥 PyTorch 大会 2024 公布演讲嘉宾名单

🐟 Sakana AI 完成1亿美元A轮融资，与英伟达达成合作

🤖 斯坦福研究：

AI或被用于生成外国势力说服性宣传

🤖 Cohere 将在 Oracle CloudWorld 展示 AI 商业应用

🧠 AI研究者举办周度论文讨论会，涵盖多个前沿领域

🔥 PyTorch 2024大会公布IBM高管演讲

版权声明：
作者：shadowrocket
链接：https://www.shadowrocket8.top/197.html
来源：Shadowrocket官网
文章版权归作者所有，未经允许请勿转载。

THE END

二维码

AI快讯MistralAI发布新模型欧盟启动人工智能工厂计划Meta广告数据安全Wa

< <上一篇

去重神器SemHash每秒22万条快如闪电已开源

下一篇>>

搜索内容

AI快讯Ilya公司融资10亿美元千问手写OCR准确率100AlphaFold3开源实现

取消回复

共有 0 条评论

Shadowrocket高速节点推荐

热门文章

好用的小火箭节点推荐 Shadowrocket 高速节点

AI快讯Ilya公司融资10亿美元千问手写OCR准确率100AlphaFold3开源实现

取消回复

共有 0 条评论

Shadowrocket高速节点推荐

热门文章

好用的小火箭节点推荐 Shadowrocket 高速节点