AI快讯MistralAI发布新模型欧盟启动人工智能工厂计划Meta广告数据安全Wa

🔗 Mistral AI新模型Pixtral上线
🚀 前OpenAI研究员Alexis Conneau创办新公司,正在招募感兴趣的人才
🇪🇺 欧盟启动人工智能工厂计划 提供超算等基础设施
🇯🇵 Sakana AI获日本政府GENIAC项目超算补助,加速先进AI模型研发
🔒 Meta 确保广告数据不离开服务器
🖼️ Gradio 推出图片对象背景去除工具
🤖 AI研究者计划本地部署Qwen-2-VL并测试量化方法
🚗 报告: Waymo无人车安全性优于人类驾驶
🗳️ 2024选举辩论中AI的讨论地位
🔍 GOT模型推动OCR-2.0实现重大突破
🌾 贝克汉姆农场生活与AI语言推广
🧠 LLM微调与响应格式的最佳实践
💎 DeepMind工具在材料科学领域取得突破
🤔 Reflection-70B事件引发AI信息传播责任讨论
🎵 SongCreator: AI从歌词生成完整歌曲
①👉Mistral AI新模型Pixtral上线
Mistral AI 发布了其最新的开源语言模型「Pixtral-12B」。该模型以12B参数开发,并提供了多种下载链接供用户获取。
相关链接:
tracker.opentrackr.org [1]
open.demonii.com [2]
tracker.ipv6tracker.org [3]
Vaibhav (VB) Srivastav 在推文中表示祝贺,并提到该模型已在 Hugging Face 社区上传,可以通过以下链接获取:
huggingface.co/mistral-community/pixtral-12b-240910 [4]
②👉前OpenAI研究员Alexis Conneau创办新公司,正在招募感兴趣的人才
前OpenAI研究员Alexis Conneau宣布离职,正式开始创办新公司。
Alexis Conneau在推特上表示,经过在OpenAI度过的"令人惊奇的旅程",他已决定创办一家新公司。他希望能找到对此感兴趣的人才加入,一起打造"具有魔力"的新项目。

Conneau此前在OpenAI担任重要研究职务,领导了GPT-4和GPT-5的研发工作。业内人士表示,他的离职将是OpenAI未来发展的一大变数。
Conneau在推特上表示,关于新公司的更多信息将陆续公布。有意向者可以直接与他联系。
③👉欧盟启动人工智能工厂计划 提供超算等基础设施
欧盟委员会主席乌尔苏拉·冯德·莱恩宣布启动人工智能工厂计划。该计划将提供EU资金支持,建设为欧盟AI初创企业和产业提供以下基础设施的设施:
获取超级计算机
获取数据和存储资源
建立协作网络
冯德·莱恩表示,这是为了帮助欧盟AI企业和产业获得成功所需的全部要素。通过建设这些"AI工厂",欧盟希望进一步推动AI技术在欧洲的发展和应用。
④👉Sakana AI获日本政府GENIAC项目超算补助,加速先进AI模型研发
Sakana AI 宣布,该公司是7家被日本政府选中的机构之一,获得「GENIAC」(Generative AI Accelerator Challenge)超级计算资助。
这个由日本经济产业省(METI)下属的新能源和产业技术综合开发机构(NEDO)组织的GENIAC项目旨在加强日本在后5G时代的人工智能技术基础设施。获得资助的7家机构将获得配备最新GPU的超级计算集群,在2024年用于开发先进的基础AI模型。
更强大的计算资源助力Sakana AI的研究
Sakana AI表示,尽管目前公司还处于「缺乏GPU」的状态,但借助这批新的超算资源,他们将能够更好地扩展和开发基于自然启发的AI模型。
「我们正在进行许多令人兴奋的项目,这笔补助将为我们提供更强大的计算能力,助力我们在日本进一步推进我们的核心理念。」
Sakana AI鼓励对这些工作感兴趣的人查看公司的招聘信息,了解更多加入该团队的机会。

关于GENIAC项目
GENIAC 是日本政府为加强日本在生成式AI领域的技术实力而设立的一个项目。从去年开始,NEDO就一直在募集研发提案,旨在提升日本在后5G时代的技术基础设施。获选的7家机构将在2024年获得先进的GPU集群进行训练。
除了Sakana AI,还有6家其他机构同样获得了这一补助。日本希望通过这个项目,推动该国生成式AI生态系统的发展。
⑤👉Meta 确保广告数据不离开服务器

Meta 确保用户数据不离开其服务器 。
Yann LeCun 解释,Meta 严格保护用户数据隐私。公司会从广告商中挑选出最相关的广告,并展示给用户。所有用户数据都不会离开 Meta 的服务器,广告商也无法获取这些个人数据。
如果用户点击某个广告,广告商才会收到通知。
链接: Meta 的广告数据保护机制 [5]
⑥👉Gradio 推出图片对象背景去除工具
Gradio 为用户提供全新的「Object Cutter」工具,高效移除图片中任意对象的背景。
用户可通过文本提示或边界框进行操作,生成高清背景去除效果。
Gradio App 链接 [6]
⑦👉AI研究者计划本地部署Qwen-2-VL并测试量化方法
Hugging Face的开源研究员merve表示,她计划在本地部署运行Qwen-2-VL模型,并将利用周末时间对不同的量化方法和检查点进行基准测试。
merve打算在Twitter上分享她的测试过程,并希望能获得好运。
在回复中,merve提到她将研究llama.cpp的量化方法。
这一尝试反映了AI研究人员对优化大型语言模型本地部署性能的持续关注,特别是在视觉语言模型(VLM)领域。
⑧👉报告:Waymo无人车安全性优于人类驾驶
根据最新报告,Waymo无人驾驶汽车不仅发生严重事故的频率远低于人类驾驶的车辆,而且发生的事故绝大多数是由其他人类驾驶员造成的。
报告显示,大量事故是由人类驾驶员追尾Waymo车辆或闯红灯引起的。这些数据凸显了Waymo无人驾驶技术在道路安全方面的优势。

图表清楚地展示了Waymo车辆与其他车辆在事故责任方面的对比。Waymo车辆在绝大多数情况下都不是事故的责任方。
这份报告为无人驾驶技术在提高道路安全性方面的潜力提供了有力证据,同时也凸显了人类驾驶行为仍然是当前道路安全的主要挑战。
详细报告链接:https://www.understandingai.org/p/human-drivers-are-to-blame-for-most
⑨👉2024选举辩论中AI的讨论地位
今早,一位AI专家公开质疑,今年的总统选举和辩论是否会就AI以外的话题展开讨论,考虑到该领域的快速进展。他希望在今晚的辩论中能听到AI会否超越单纯的附带话题。
几个月前,有一项在AI实验室人员中的民调,关于AI是否将在2024年选举辩论中成为主要议题,结果显示约50%以上投票认为肯定。然而,今晚辩论中唯一提到的是「我们必须在AI和量子计算中领先」,因此,可以推测AI未成为主要讨论点。
⑩👉GOT模型推动OCR-2.0实现重大突破
GOT(General OCR Theory)模型作为OCR-2.0的核心,通过生成式AI和多模态大语言模型全面提升了OCR性能。
GOT模型具有580M参数,由「Vision-Encoder」和解码器构成,能将图像转换为多种格式的OCR输出,如纯文本、markdown、Mathpix等。该系统专为处理复杂任务设计,如表格、公式和几何形状。
实现包括:
视觉编码器预训练 :使用VitDet训练识别场景文本和文档OCR数据。
联合训练 :编码器与Qwen-0.5B解码器结合,处理一般OCR任务。
后期训练 :通过新合成数据集针对特定任务进行微调,如细粒度OCR、多页PDF、动态分辨率。
GOT模型实现上的主要发现:
80M的VitDet编码器和500M的Qwen2解码器,支持8k上下文。
达到0.035的编辑距离和0.972的BLEU分数。
在文档和场景文本OCR中超越LLaVA-NeXT和Qwen-VL-Max。
能从Arxiv提取LaTeX公式并转换为Mathpix格式。
支持动态分辨率和多页OCR,输入分辨率可达1024x1024。
论文及实现代码可在下列链接中查看:
论文链接 [7] Github链接 [8]

⑪👉贝克汉姆农场生活与AI语言推广
贝克汉姆从球场转向农场,尽享退休生活。
同时,他借助AI视频本地化技术,实现多语言沟通。
Synthesia的技术使贝克汉姆能够流畅地用9种语言表达信息。
2019年,一项疟疾宣传活动的本地化需要数周完成。
现今,通过AI视频本地化流程,类似任务可在数分钟内完成。
详细信息链接 [9]
活动链接 [10]
⑫👉LLM微调与响应格式的最佳实践
Yifei Hu分享了关于大型语言模型(LLM)微调、响应格式和系统信息的一些见解。
微调过程应遵循「展示而非告知」的原则。若希望模型输出特定格式,微调数据应以该格式呈现。
若微调示例已具有目标结构,无需通过系统信息指定输出结构,以此节省令牌。
曾尝试在较小的LLM上应用复杂的XML模式,约3000个示例即可实现99%以上的格式合规性,系统信息的变化对输出影响较小。
添加「认真思考」等附加说明不会提升准确性,除非这样的前缀存在于微调数据中,否则只是无根据的期望。


此外,LIMA论文指出,只需少量示例即可让LLM以期望格式/风格响应。

Lucas Beyer也赞同这些观点,强调自动回归解码器语法学习的简单性。许多人从零样本提示转向微调时会遗漏这些要点,这是错误的做法。
⑬👉DeepMind工具在材料科学领域取得突破
DeepMind工具在材料科学领域取得突破
Google DeepMind表示,其开发的材料科学工具「GNoME」已取得重大进展,帮助发现了数以百万计的新型晶体结构。GNoME 的技术负责人 Amil Merchant 被美国《技术评论》杂志评选为2024年35岁以下创新者。
DeepMind 团队表示,他们致力于利用人工智能解决重大科学难题,以推进科学发展,造福人类。Amil Merchant 获此殊荣,也证明了 DeepMind 在材料科学领域的卓越成就和技术实力。
DeepMind工具 [11]
该工具的具体应用成果及Amil Merchant的创新贡献,可参见 DeepMind发布的相关报告 [12] 。
⑭👉Reflection-70B事件引发AI信息传播责任讨论
Maxime Labonne在社交媒体上发文,针对近期Reflection-70B模型性能被夸大的事件进行了深入讨论,引发了对AI领域信息传播责任的思考。
Labonne指出,在这次事件中真正获利的是AI影响者。他们通过分享未经验证的轰动性声明获得了更多的浏览量和关注者,却没有承担相应的责任。

Labonne认为这种情况很可能会再次发生,同样的推文、文章和视频会不断出现。他将这种现象比喻为「不要恨玩家,要恨游戏规则」,指出当前的系统实际上在奖励那些传播错误信息的行为。
尽管个人可能会被误导,但Labonne强调需要追究责任。如果没有惩罚机制,这个系统将继续滋生欺诈行为的传播。
Labonne还指出,即使Reflection-70B模型最终证明是有效的,也不能改变人们大量分享未经验证信息的事实。他分享了自己对该模型进行的基准测试结果,证实了之前公布的API和Hugging Face模型都存在问题。

最后,Labonne表示这种现象不应被简单地视为互联网常态。它可能会掩盖像DeepSeek AI这样重视科学的团队所做的优秀工作。相反,当前的环境正在激励每个人用耸人听闻的内容相互喧嚣,以获取点击量。
这一事件引发了AI社区对信息传播责任和学术诚信的深度讨论,呼吁建立更严格的信息验证机制和职业道德标准。
⑮👉SongCreator:AI从歌词生成完整歌曲
研究人员开发了一个名为SongCreator的新型歌曲生成系统,该系统能够基于歌词生成包含人声和伴奏的完整歌曲。
SongCreator采用了两项创新设计:
精心设计的双序列语言模型(DSLM),用于捕捉人声和伴奏的信息
DSLM的额外注意力掩码策略,使模型能够理解、生成和编辑歌曲
这些设计使SongCreator适用于各种与歌曲相关的生成任务。在八项任务中,系统均达到了最先进或具有竞争力的表现。特别是在歌词到歌曲和歌词到人声的任务中,SongCreator大幅超越了之前的工作。
此外,SongCreator还能通过不同的提示独立控制生成歌曲中人声和伴奏的声学条件,展示了其潜在的应用价值。

详细信息可参考论文:https://huggingface.co/papers/2409.06029
👇
👇
👇
受篇幅限制,下述 28条 快讯可点击 阅读原文 查看详情。
🤖 政府收紧 AI 监管能否加速技术突破
🧠 SaRA: 高效扩散模型微调新方法
🔍 Reflection Llama 3.1 70B 模型争议及数据调优方法
🌐 快速生成网站工具用户达2000万
🔄 VAE循环过程中状态变化的理论研究
🎬 Draw an Audio: 多指令视频到音频合成新模型
🧠 研究: 代码数据对LLM预训练至关重要
🖼️ Mistral AI 的 Pixtral 模型登陆 Hugging Face 社区
🤖 Groq招聘扩张项目经理,推进平价普惠AI
📷 GeoCalib: AI助力单图像校准
🏆 WiML成员Sasha Luccioni入选《时代》AI 100榜单
🔄 Jina AI 发布小型语言模型 Reader-LM,高效转换 HTML 到 Markdown
🔧 Hugging Face研究员更新IDEFICS3Llama项目工具
🤖 Andreessen声援AI安全研究
🤖 Llama 3.1 70B 在 Jetson 设备上高效运行
🧬 AI在基因组健康预测中的作用与风险
🤖 AI研究者发现结构化生成算法缺陷
🔬 TuringPost精选: 本周9大AI/ML研究热点
🧐 AI研究社交媒体化引发质疑
🖋️ Gradio 推出 LLM 驱动的写作助手 Recall Mate
🖥️ 日本将建造全球首台 zeta 级超级计算机
🎥 Synthesia参展伦敦Learning Live
❓ 用户质疑GoogleAI集成复杂性
🚗 纽约时报揭示: 自动驾驶汽车并非完全自动
🔬 研究揭示 ControlNet 训练和数据集优化方法
🧠 Alan Turing研究所探讨数据科学与AI职业多元技能
🧠 选择性反思调优: 提升AI模型性能的新方法
🎓 OpenAI在伯克利举办首届校园招聘
受篇幅限制,上述 28条 快讯可点击 阅读原文 查看详情。
相关链接
[1] tracker.opentrackr.org: http://2Ftracker.opentrackr.org
[2] open.demonii.com: http://2Fopen.demonii.com
[3] tracker.ipv6tracker.org: http://2Ftracker.ipv6tracker.org
[4] huggingface.co/mistral-community/pixtral-12b-240910: https://huggingface.co/mistral-community/pixtral-12b-240910
[5] Meta 的广告数据保护机制: https://x.com/ylecun/status/1833848120804782091?t=q24Cj1JaEUn4yZWWDM0V3A&s=19
[6] Gradio App 链接: https://huggingface.co/spaces/finegrain/finegrain-object-cutter
[7] 论文链接: https://huggingface.co/papers/2409.01704
[8] Github链接: https://github.com/Ucas-HaoranWei/GOT-OCR2.0
版权声明:
作者:shadowrocket
链接:https://www.shadowrocket8.top/187.html
来源:Shadowrocket官网
文章版权归作者所有,未经允许请勿转载。


共有 0 条评论