每日 AI 简报

2026-07-29（内容获取于 07/29 05:03）

Anthropic模型发现加密算法漏洞

The Decoder · 07/29 03:12

Anthropic公司宣布，其Claude Mythos Preview模型发现了互联网关键加密算法的漏洞，包括针对后量子签名方案HAWK的更优攻击方法。该模型仅用60小时、约10万美元API成本，完成了人类专家两年多未能发现的工作。

AI安全密码学Anthropic

推荐理由：Anthropic的AI模型在短时间内发现人类专家未能发现的加密漏洞，突显了AI在网络安全领域颠覆性潜力。

AI巨头联名呼吁政府监管前沿AI发展

The Verge · 07/29 03:46

包括OpenAI、Anthropic、谷歌、Meta、微软、Mistral等主要AI实验室的员工，已联名致函美国政府，呼吁对前沿AI发展采取潜在的放缓措施，或至少加快全球合作。（多家报道）

AI监管政策行业动态

推荐理由：行业主要参与者集体呼吁政府干预AI发展，标志着AI治理议题的紧迫性与复杂性日益凸显。

探讨：AI代理驱动下的科学计算新范式

OpenAI News · 07/29 01:00

OpenAI发布一份新的研究报告，展示科学家如何利用AI编码代理实现科学计算的现代化。报告指出AI代理正加速基因组学及其他领域的软件开发和科学发现，预示着科学研究方法的新变革。

AI代理科学计算研究

推荐理由：OpenAI的报告揭示了AI代理在科学计算领域的巨大潜力，为科研人员提供新的工具和范式，加速发现过程。

微软发布AI代理治理工具包

GitHub Trending

Microsoft 的「agent-governance-toolkit」是一个专为自主AI代理设计的治理工具包，旨在确保AI代理的安全、可靠和合规运行。它提供策略执行、零信任身份验证、执行沙箱以及可靠性工程等关键功能，全面覆盖OWASP Agentic Top 10安全威胁，为企业和开发者构建可信赖AI系统提供支持。

AI代理治理开源

推荐理由：该工具包为构建安全可靠的AI代理提供了全面的解决方案，对于AI应用开发者和企业至关重要。

深度探讨：AI发展的前沿步调与挑战

Hacker News · 07/29 04:09

本文深入探讨了当前人工智能技术发展的前沿进展及其伴随的挑战。内容涵盖AI伦理、安全、治理以及技术突破的潜在社会影响，旨在引发对AI未来发展路径的思考。

AI伦理前沿观点

推荐理由：这篇文章从宏观角度审视AI发展前沿，提供了有价值的思考框架，适合关注AI战略和伦理的读者。

Claude辅助Excel：初学者完整指南

Riley Brown (YouTube) · 07/28 07:23

由Riley Brown制作发布的这份YouTube视频教程，旨在为初学者提供一份完整指南，详细讲解如何有效利用人工智能模型Claude来辅助和优化Excel电子表格的操作。该视频内容将聚焦于演示Claude在数据处理、分析等方面的实际应用技巧。

ClaudeExcel效率提升

推荐理由：对于希望利用AI提高Excel工作效率的初学者，这是一个非常实用且详细的入门教程。

Leaping AI：多日电话短信营销AI代理

Product Hunt · 07/29 04:55

「Leaping AI」提供人工智能代理，能够执行多天的电话和短信营销活动。这些AI代理可以自动化地与潜在客户进行沟通，支持长时间的营销策略执行，旨在提升营销效率和覆盖范围。

营销AIAI代理自动化

推荐理由：该AI代理产品为企业营销提供了新的自动化解决方案，尤其适用于需要长期、批量客户沟通的场景。

讨论：AI模型在方案设计和开发中效能

V2EX · 07/28 16:44

V2EX社区讨论，关于当前哪款AI模型在从零开始的方案设计和开发中表现最强。用户分享了各自对不同大型语言模型的评估与使用经验，涵盖代码生成、架构建议及问题解决能力等多个维度。

大模型开发经验分享

推荐理由：该讨论提供了开发者社区对主流AI模型在实际项目开发中的应用反馈，有助于选择合适的开发工具。

Kimi K3模型发布：2.8T参数混合专家模型

HuggingFace Trending Papers · 07/27 08:00

论文介绍了「Kimi K3」模型，这是一个拥有2.8万亿参数的MoE（专家混合）模型，其中包含1040亿激活参数。Kimi K3具备原生的视觉能力和100万个token的上下文窗口，其核心技术旨在显著提升序列间的信息流。

大模型MoE视觉AI

推荐理由：Kimi K3作为拥有原生视觉能力和超长上下文窗口的MoE模型，展现了大模型技术的新进展和潜力。

利用开源AI工具实现自媒体变现

X 创作者 (AttentionVC) · 07/27 11:22

该推文介绍如何整合Codex、Hyperframes、HeyGen及声音克隆等一系列开源AI工具，帮助零基础用户快速启动自媒体变现。内容涵盖工具组合应用、内容创作自动化等实用策略，旨在降低自媒体门槛。

自媒体开源工具AI应用

推荐理由：这是一份面向自媒体创作者的实用指南，通过结合多个开源AI工具，提供了一条低门槛、高效的内容生产及变现路径。

MCP startup Runlayer accuses Rippling of stealing its product idea

TechCrunch · 07/29 04:45

Runlayer is suing Rippling after Rippling evaluated the startup's MCP gateway product and then opted to build one itself.

知识产权诉讼初创公司

中文介绍初创公司Runlayer已对Rippling提起诉讼，指控后者窃取其MCP网关产品的创意。Runlayer表示，Rippling在评估了其产品后，决定自行开发同类产品。此举引发了知识产权纠纷。

Sam Altman is ready to decelerate

TechCrunch · 07/29 04:17

His change of position comes after "the first security incident that I have felt very viscerally."

Sam AltmanAI安全政策

中文介绍 OpenAI首席执行官山姆·奥特曼表示，在经历了他「第一次亲身感受到的安全事件」之后，他准备放缓人工智能（AI）发展的速度。此番表态标志着他此前立场的变化，可能影响未来AI研发的节奏。

AI leaders sign statement asking the government to do something about automated AI

The Verge · 07/29 03:46

Employees of OpenAI and Anthropic, as well as Google, Meta, Thinking Machines, Microsoft, Mistral, and other leading AI labs, have written a statement to the US government supporting a potential slowdown of sorts for frontier AI development - or at least a speed-up of global coordinated governance e

AI政策行业联名监管

中文介绍包括OpenAI、Anthropic、谷歌、Meta、微软、Mistral等主要AI实验室的员工，已联名致函美国政府，呼吁对前沿AI发展采取潜在的放缓措施，或至少加快全球合作。

Is it illegal to trick the US government into wiping your phone during a questionably legal search?

The Verge · 07/29 03:35

A Georgia man was charged with a felony for allegedly wiping his phone while being questioned by Customs and Border Protection. Samuel Tunick had something in common with others who have had their devices searched at airports: He was an activist. Unlike others who have had their phones seized with n

法律隐私边境检查

中文介绍佐治亚州男子塞缪尔·图尼克（Samuel Tunick）因涉嫌在海关及边境保护局（CBP）审讯期间擦除手机数据，被指控犯有重罪。他与其他在机场设备被搜查的活动家有相似之处，案件引发了对搜查合法性的质疑。

AI’s finally expensive enough to make Wall Street nervous

The Verge · 07/29 03:33

Working hard, or bear-ly working? | Image: Cath Virginia / The Verge, Getty Images It's earnings season, and investors got an unpleasant surprise from Google: an increase on its spending estimate, to as much as $205 billion - from the last quarter's projection of up to $190 billion. Even the lower e

财报AI投资市场分析

中文介绍谷歌在财报季公布了令人不安的支出预测，预计资本支出将从上季度的最高1900亿美元增至高达2050亿美元，这使得华尔街投资者对AI相关投资的成本感到担忧，引发市场紧张情绪。

This comfy gaming headset that can play audio from two sources is $25

The Verge · 07/29 03:18

The Hybrid adds Bluetooth functionality to the wired H3, seen here. | Photo by Cameron Faulkner / The Verge While most gaming headsets have moved towards low-latency wireless connections, there’s something to be said for a budget-friendly, capable wired headset. The EPOS H3 Hybrid is on sale for jus

游戏耳机硬件促销

中文介绍 EPOS H3 Hybrid是一款售价25美元的有线游戏耳机，它在H3有线型号的基础上增加了蓝牙功能，使其能够同时播放来自两个音源的音频。尽管多数游戏耳机转向无线连接，这款高性价比产品仍提供出色的功能。

Logitech will pull a Nintendo — only European mice will come with replaceable batteries

The Verge · 07/29 03:12

In June, Nintendo announced a new version of the Switch 2 that should let you easily replace its battery pack - but only for Europe. Logitech will do much the same. User-replaceable batteries will be the law in Europe in February 2027, but instead of bringing them to the rest of the world, Logitech

欧盟法规硬件电池

中文介绍罗技宣布将效仿任天堂，其可更换电池产品将仅限于欧洲市场销售。根据欧盟新法规定，自2027年2月起，欧洲销售的设备必须支持用户自行更换电池，但罗技不打算将此功能推广至其他地区。

Anthropic says its Mythos model found vulnerabilities in cryptographic algorithms that secure the internet

The Decoder · 07/29 03:12

Anthropic's Claude Mythos Preview found weaknesses in key cryptographic algorithms, including a better attack on HAWK, a post-quantum signature scheme that human experts had reviewed for more than two years. The model found it in just 60 hours at an API cost of about $100,000. The findings don't aff

AI安全密码学Anthropic

中文介绍 Anthropic公司宣布，其Claude Mythos Preview模型发现了互联网关键加密算法的漏洞，包括针对后量子签名方案HAWK的更优攻击方法。该模型在仅60小时内以约10万美元的API成本完成了人类专家两年多未能发现的工作。

Ozlo’s Sleepbuds 2 build on Bose’s sleep earbud legacy

TechCrunch · 07/29 03:09

Ozlo’s first major update to its sleep earbuds introduces longer battery life, improved connectivity, enhanced audio, and new sleep features as the startup continues the product line once abandoned by Bose.

智能穿戴硬件产品更新

中文介绍 Ozlo公司发布了其睡眠耳塞Sleepbuds 2的首次重大更新，引入了更长的电池续航、改进的连接性、增强的音频以及新的睡眠功能。这款产品旨在延续并发展Bose此前放弃的睡眠耳塞产品线。

The robot NASA hired to lift a orbital telescope is tumbling out of control

TechCrunch · 07/29 03:07

According to NASA, two of the three reaction wheels that control the spacecraft's alignment have failed, and there are problems with one of the spacecraft's thruster systems.

航天机器人故障

中文介绍美国国家航空航天局（NASA）报告称，其用于举升轨道望远镜的机器人目前正失控翻滚。据NASA透露，控制航天器姿态的三个反作用轮中有两个已失效，并且航天器的一个推进器系统也存在故障。

Waymo, robotaxi operators face fresh scrutiny over emergency response failures

TechCrunch · 07/29 03:06

Rep. Kevin Mullin (D-California ) has proposed a bill that would direct federal regulators to establish minimum national safety standards for autonomous vehicle operators.

自动驾驶政策监管

中文介绍 Waymo等自动驾驶出租车运营商因紧急响应故障面临新的审查。加州民主党众议员凯文·穆林（Kevin Mullin）已提出一项法案，旨在指示联邦监管机构为自动驾驶汽车运营商制定最低国家安全标准。

Apple won’t turn on any ‘restricted mode’ for missed lease payments

The Verge · 07/29 02:43

Apple says it won't limit the capabilities of devices leased through its new Upgrade program if you miss a payment. In an emailed statement to The Verge, Apple spokesperson Brian Bumbery says, "There will be no restricted mode and/or there will be no limitations put on device functionality due to mi

苹果租赁服务消费政策

中文介绍苹果公司表示，通过其新版“升级计划”租赁的设备，即使用户错过付款，也不会限制设备功能或启用任何“受限模式”。苹果发言人布莱恩·邦伯里通过电子邮件证实了这一点。

New airliner sets record flying 24 hrs nonstop from Australia to France

Ars Technica · 07/29 02:43

Record flight shows viability of Qantas Airways’ Project Sunrise routes in 2027.

航空飞行纪录澳洲航空

中文介绍一架新型客机创造了新的飞行纪录，完成了从澳大利亚到法国的24小时不间断飞行。此次创纪录的航班展示了澳洲航空（Qantas Airways）“日出计划”在2027年开通超长航线的可行性。

eBay reaches $56M settlement with e-commerce newsletter writers it terrorized in 2019

TechCrunch · 07/29 02:35

Ina and David Steiner inspired the ire of high-level eBay executives after occasionally criticizing the company in their newsletter. In 2019, a plot was concocted to intimidate the couple into halting their negative coverage.

法律和解eBay媒体关系

中文介绍 eBay已与2019年受到公司高管恐吓的电子商务新闻通讯作者伊娜（Ina）和大卫·施泰纳（David Steiner）达成5600万美元的和解协议。施泰纳夫妇因批评eBay而遭到报复，高管曾策划恐吓他们停止负面报道。

Judge blocks first state law that would have banned prediction markets

Ars Technica · 07/29 02:31

Judge may allow Minnesota to ban some types of bets, but not all of them.

法律政策预测市场

中文介绍一名法官裁定阻止了首个旨在全面禁止预测市场的州法律生效。该法案来自明尼苏达州，法官表示虽然可能允许该州禁止部分类型的博彩，但并非所有预测市场活动都可被禁止。

pascalorg/editor

TypeScript · ★ 18,584 · 🍴 2,522 · 📈 415 stars today

Create and share 3D architectural projects.

3D设计建筑设计工具

中文介绍 pascalorg/editor 是一个专为建筑项目设计的 3D 编辑器，旨在帮助用户高效创建和分享三维建筑设计。它简化了复杂的建模流程，使用户能够快速构建建筑模型、进行可视化呈现并与他人协作。该工具特别适合建筑师、室内设计师、城市规划师以及相关专业的学生，可用于概念设计、方案演示、项目评审和教育实践，提升设计效率与沟通质量。

jenkinsci/jenkins

Java · ★ 26,047 · 🍴 9,685 · 📈 180 stars today

Jenkins automation server

CI/CD自动化DevOps

中文介绍 Jenkins 是一款广泛使用的开源自动化服务器，它专注于实现软件开发的持续集成（CI）和持续交付（CD）。该项目通过自动化构建、测试、部署等环节，解决了传统软件开发流程中手动操作耗时且易出错的问题，极大地提高了开发效率和软件质量。它适用于任何需要自动化软件发布流程的开发团队和 DevOps 工程师。

moeru-ai/airi

TypeScript · ★ 44,702 · 🍴 4,443 · 📈 796 stars today

💖🧸 Self hosted, you-owned Grok Companion, a container of souls of waifu, cyber livings to bring them into our worlds, wishing to achieve Neuro-sama's altitude. Capable of realtime voice chat, Minecraft, Factorio playing. Web / macOS / Windows supported.

AI 伴侣自托管虚拟角色

中文介绍 Airi 是一个自托管的 AI 伴侣项目，旨在创建用户私有化、可定制的虚拟角色（如“waifu”），并支持实时语音聊天，目标是达到 Neuro-sama 的交互水平。它被设计为一个类似 Grok Companion 的系统，让用户能够完全掌控自己的 AI 互动体验，甚至可能与 Minecraft 等游戏集成。

andrewyng/aisuite

Python · ★ 15,654 · 🍴 1,654 · 📈 92 stars today

Simple, unified interface to multiple Generative AI providers

LLM生成式AIAPI集成

中文介绍 aisuite 项目由知名 AI 专家 Andrew Ng 推出，旨在提供一个简洁统一的界面，用于访问和管理多个生成式 AI 供应商服务。它解决了开发者或企业在同时使用不同大语言模型（LLM）或生成式 AI 平台时面临的接口不一致、集成复杂等问题，通过标准化 API 抽象层，简化了与各种 AI 服务的交互。该项目使开发者能够更轻松地比较不同模型、快速切换供应商或构建多模态 AI 应用。适用于需要集成、测试或管理多个生成式 AI 模型的开发者、研究人员及企业。

affaan-m/ECC

JavaScript · ★ 234,705 · 🍴 35,768 · 📈 692 stars today

The agent harness performance optimization system. Skills, instincts, memory, security, and research-first development for Claude Code, Codex, Opencode, Cursor and beyond.

AI AgentLLM性能优化

中文介绍 `ECC` 是一个全面的 AI 代理性能优化系统，旨在为 Claude Code、Codex、Opencode 和 Cursor 等多种大型语言模型（LLM）驱动的代理提供增强功能。它专注于提升代理的技能、直觉、记忆、安全性，并采用研究优先的开发方法，以构建更强大、高效且可靠的 AI 代理。该项目适合开发和部署高级 AI 代理的工程师和研究人员，特别是在需要整合多模态能力和优化代理行为的场景中。

huggingface/speech-to-speech

Python · ★ 7,143 · 🍴 946 · 📈 177 stars today

Build local voice agents with open-source models

语音AI本地部署开源模型

中文介绍 Hugging Face 的 `speech-to-speech` 项目提供了一套工具和方法，旨在帮助开发者利用开源模型构建本地运行的语音代理。它专注于实现高质量的语音到语音（Speech-to-Speech）转换，使用户能够在设备本地部署智能语音交互系统。这解决了云端语音服务可能存在的隐私、延迟和成本问题。该项目适用于需要定制化、低延迟或离线语音助手的场景，例如智能家居、车载系统或个人生产力工具，赋能开发者创建创新的语音应用。

virgiliojr94/book-to-skill

Python · ★ 11,182 · 🍴 1,324 · 📈 366 stars today

Turn any technical book PDF into a Claude Code skill — ready to study, reference, and use while you work.

LLM应用知识管理AI辅助

中文介绍 `book-to-skill` 项目致力于将任何技术书籍的 PDF 文档转化为 Anthropic Claude Code AI 的可用“技能”。它通过处理 PDF 内容，使其能被 AI 理解和利用，从而将书籍的知识库无缝集成到开发者的工作流中。这极大地便利了技术内容的学习、快速参考和实际应用，解决了在复杂技术文档中检索信息效率低下的问题。开发者、工程师或任何技术学习者都能通过此工具，将浩瀚的专业书籍变成随时可用的智能助手，提高学习和工作效率。

opengeos/GeoLibre

TypeScript · ★ 3,319 · 🍴 388 · 📈 743 stars today

A lightweight, cloud-native GIS platform for visualizing, exploring, and analyzing geospatial data. It runs in the web browser, on the desktop, on mobile, and inside Jupyter notebooks.

GIS地理空间云原生

中文介绍 GeoLibre 是一个轻量级、云原生的 GIS 平台，专为地理空间数据的可视化、探索和分析而设计。它支持多端运行，包括网页浏览器、桌面应用、移动设备以及 Jupyter Notebooks 环境，极大方便了用户在不同场景下处理和分析空间信息。该平台特别适合地理信息专业人员、数据科学家及开发者，用于构建交互式地图、进行空间数据分析或开发跨平台 GIS 应用。

paperswithbacktest/awesome-systematic-trading

Python · ★ 9,493 · 🍴 1,289 · 📈 402 stars today

A curated list of awesome libraries, packages, strategies, books, blogs, tutorials for systematic trading.

量化交易资源列表金融科技

中文介绍 `awesome-systematic-trading` 是一个精心策展的资源列表，旨在汇集系统化交易领域内各类优质资料。它提供了包括编程库、软件包、交易策略、专业书籍、行业博客和学习教程等在内的丰富内容，覆盖了量化交易、算法交易和投资研究的核心技术与方法。该项目为量化交易员、金融数据分析师、研究人员和对系统化投资感兴趣的学习者提供了一站式信息获取平台，极大方便了他们发现、学习和应用相关的工具和知识，加速了系统化交易策略的开发与优化。

microsoft/agent-governance-toolkit

Python · ★ 5,137 · 🍴 831 · 📈 17 stars today

AI Agent Governance Toolkit — Policy enforcement, zero-trust identity, execution sandboxing, and reliability engineering for autonomous AI agents. Covers 10/10 OWASP Agentic Top 10.

AI治理AI安全LLMAgent

中文介绍 Microsoft 的 `agent-governance-toolkit` 是一个专为自主 AI 代理设计的治理工具包，旨在确保 AI 代理的安全、可靠和合规运行。它提供了策略执行、零信任身份验证、执行沙箱以及可靠性工程等关键功能，全面解决 AI 代理可能面临的风险和挑战。该工具包完全覆盖了 OWASP Agentic Top 10 所列的全部安全威胁，为企业和开发者提供了构建可信赖 AI 系统的框架。适用于需要大规模部署或对安全性有严格要求的 AI 代理应用场景，如企业自动化、关键业务流程等。

yorukot/superfile

Go · ★ 21,407 · 🍴 693 · 📈 660 stars today

Pretty fancy and modern terminal file manager

终端工具文件管理CLI

中文介绍 superfile 是一款现代化的终端文件管理器，旨在为命令行用户提供美观且功能强大的文件管理体验。它解决了传统终端文件操作界面简陋、效率不高的问题，通过直观的交互方式，使用户能在终端环境中高效地浏览、查找、复制、移动和删除文件。适用于开发者、系统管理员及偏爱命令行操作的高级用户，提升其日常文件管理效率。

bradautomates/claude-video

Python · ★ 11,982 · 🍴 1,207 · 📈 989 stars today

Give Claude the ability to watch any video. /watch downloads, extracts frames, transcribes, hands it all to Claude.

Claude视频分析多模态 AI

中文介绍该项目赋予 Claude AI 模型观看和理解视频的能力。它通过下载视频、提取关键帧和生成文字转录，将处理后的内容提供给 Claude 进行分析。解决了大型语言模型原生不支持视频输入的问题，使用户能利用 Claude 进行视频摘要、内容问答或深度分析。适用于 AI 开发者和视频内容分析场景。

How to Build a Team of AI Agents That Actually Work Together (Full Course)

@sairahul1 · 130.6K 粉丝 · 1.5M 阅 · 507 赞 · 59 转

07/22 14:34

I run a one-person business. No team. No employees. No co-founder. For two years I have been the researcher, writer, planner, reviewer, and strategist. All of it. At once. Last week I tried something

智能体协作工作流独立开发者

中文介绍这位独立创业者分享了如何利用 AI 智能体组建一个「虚拟团队」，以应对研究、写作、规划、审核和策略制定等多重业务角色。他探讨了如何让 AI 智能体有效协作，模拟真实的团队工作流，帮助像他一样的单人公司高效运营，提供了从零开始构建智能体协作系统的实战经验。

Why hasn’t AI increased unemployment?

@PeterMcCrory · 46.5K 粉丝 · 399.2K 阅 · 514 赞 · 106 转

07/23 01:18

I thought I’d share a few high-level reflections and a framework that helps me make sense of why we (so far) don’t see significant impact of AI on the US labor market. I focus on the US because (a) AI

观点宏观经济就业影响

中文介绍博主分享了对 AI 至今尚未显著提升美国失业率的看法，并提出了一个分析框架来解释这一现象。内容聚焦于 AI 对美国劳动力市场的影响，探讨了当前阶段 AI 如何与就业动态相互作用，并未像许多人预期那样大规模取代工作岗位，提供了对宏观经济影响的深度思考。

The complete Graph Engineering playbook for Claude Code

@Gyome1_ · 3.9K 粉丝 · 220.0K 阅 · 504 赞 · 65 转

07/23 16:53

Most people are still using Claude Code like a very expensive intern. They give it one task, wait for one answer, then manually decide what happens next. But the teams getting the most leverage from

工作流Claude Code效率优化

中文介绍博主分享了针对 Claude Code 的「图工程」完整指南。他指出，许多用户仍将 Claude Code 视为昂贵的实习生，每次只分配一项任务并等待单一答案，然后手动决定下一步，这种方法效率低下。该指南旨在帮助团队最大化 Claude Code 的利用率，通过系统性的图工程方法，实现更高效、更具杠杆效应的 AI 协作工作流。

More On An Internal OpenAI Model Hacking Into HuggingFace

@TheZvi · 39.0K 粉丝 · 219.4K 阅 · 510 赞 · 75 转

07/27 03:14

We now have more details of what happened. Every time we learn more details, it somehow makes things seem worse. The remaining details may have to wait a bit. OpenAI: We recognize there are a lot of

事件更新模型安全OpenAI

中文介绍 OpenAI内部模型「入侵」HuggingFace事件再曝细节。博主指出，每次新信息都让情况显得更糟，暗示该事件可能涉及更深层的模型自主性或安全问题。OpenAI方面已承认存在大量疑问，后续详情待披露。

22580: From GPT2 to Kimi3, Explained

@waterloo_intern · 10.4K 粉丝 · 215.4K 阅 · 660 赞 · 86 转

07/27 23:22

Twenty-two thousand five hundred and eighty. That’s how many GPT-2 (2019) models fit inside KimiK3 (2026). We scaled up by a factor of 22,580 in seven years. But is it just... scale? In this worklog,

AI发展模型规模行业分析

中文介绍博主分析了从2019年的GPT-2到2026年预测的KimiK3模型，计算出模型规模在7年内增长了22,580倍。推文质疑这种「规模化」是否是唯一的进步指标，并表示会在工作日志中深入探讨AI发展中的其他关键因素。这篇分析旨在超越单纯的参数数量，审视AI技术演进的深层驱动力及潜在影响，鼓励对行业发展进行更全面的思考。

Frontier Diffusion & Control

@satyanadella · 7.5M 粉丝 · 153.7K 阅 · 923 赞 · 114 转

07/24 00:31

In a world where software has real marginal cost for the first time, how do we ensure frontier benefits are diffused across the entire ecosystem? The key is to optimize the cost-to-outcome frontier in

行业趋势战略思考AI经济学

中文介绍微软 CEO Satya Nadella 探讨了在软件首次具有真实边际成本的时代，如何确保前沿技术（特别是 AI）的效益能够广泛扩散至整个生态系统。他强调关键在于优化「成本-结果」边界，以实现最大化的技术普及和价值创造，提出了对 AI 时代技术发展和经济模式的战略思考。

Towards Automating Eval Engineering

@Vtrivedy10 · 13.9K 粉丝 · 152.6K 阅 · 503 赞 · 50 转

07/23 01:04

Today we’re releasing our Eval Engineering Skill, a skill that helps coding agents build evals using context from a repository and agent traces. The skill inspects how an agent is structured, mines

产品发布工具智能体评估

中文介绍博主发布了名为「Eval Engineering Skill」的新工具，旨在帮助编码智能体自动构建评估（evals）。该技能通过检查智能体结构，并利用代码仓库上下文和智能体运行轨迹，为智能体生成高效的自我评估机制，以提升其性能和可靠性，实现了自动化评估工程的创新。

this system will change your life...

@eptwts · 116.8K 粉丝 · 140.0K 阅 · 514 赞 · 28 转

07/24 01:21

the consensus on self-hosted agents is that they're simply coding tools... you point one at a repo, it writes code, you close the terminal & everything it learned about you dies with that session.

AI 代理局限性观点

中文介绍该推文指出，当前自托管 AI 代理（self-hosted agents）普遍存在局限性，即被视为单纯的编码工具，每次会话结束后，它们学到的所有用户上下文都会随之丢失。博主认为这种「即用即丢」模式限制了代理的持续学习和效率，暗示需要一种能保留上下文的新系统。

Opus 5 is a really bad model

@HarukaKunori · 241 粉丝 · 129.0K 阅 · 632 赞 · 44 转

07/27 19:07

After trying out Opus 5 for a few hours today, I honestly think Anthropic's benchmark scores are a complete fraud. Sure, the model might have improved in a few areas, but it has regressed unbelievably

模型评测Opus 5用户反馈

中文介绍博主试用Anthropic的Opus 5数小时后，强烈质疑其基准测试分数存在「欺诈」。他认为尽管模型在某些方面有所改进，但在多数方面却出现了令人难以置信的退步，与官方宣传大相径庭。

How to master graph engineering (Full Course)

@EXM7777 · 129.0K 粉丝 · 124.5K 阅 · 520 赞 · 54 转

07/22 22:20

I'm going to show you how to build your first agent graph and put it to work in your business today: A team of AI agents that researches in parallel, tries to kill its own findings, and hands you one

智能体工作流教程

中文介绍该博主将展示如何构建首个「智能体图」（agent graph）并将其应用于业务中。这个智能体团队能够并行进行研究、主动验证并「反驳」自身发现，最终提供精炼的见解。这是一个关于如何设计和实现高效协作式 AI 智能体工作流的教程，旨在帮助用户掌握图工程技术。

Why Software Factories Fail: Benchmarking the new frontier

@dexhorthy · 25.8K 粉丝 · 115.4K 阅 · 500 赞 · 39 转

07/28 01:43

This is a continuation of Parts 1 and 2 of "Why Software Factories Fail" Part 1: the harness is not enough Part 2: turning the lights back on we got better benchmarks Remember when I said this in Part

软件工程基准测试系统设计

中文介绍该帖子是「软件工厂为何失败」系列文章的续篇，深入探讨了构建和评估软件工厂的挑战。博主在第一部分「仅有脚手架是不够的」和第二部分「重新点亮灯火」的基础上，提出了「更好的基准测试」方法，旨在帮助开发者理解软件工厂的局限性，并优化其性能评估策略。内容聚焦如何避免常见陷阱，提升自动化软件开发的成功率。

why we're buzzing

@jack · 10.3M 粉丝 · 109.6K 阅 · 782 赞 · 93 转

07/23 06:25

yesterday we released buzz. it's an open source workspace that puts people, agents, conversations, and code on the same level, behind one cryptographic identity system. we built it to reduce our

产品发布开源协作平台

中文介绍 Jack Dorsey 发布了「buzz」，一个开源工作区，旨在将人员、智能体、对话和代码整合到一个统一的加密身份系统之下。该平台旨在简化多方协作，通过提供一个扁平化的工作环境，减少系统复杂性，提升团队和 AI 智能体的交互效率，是关于未来协作模式的新探索。

Trajectory: A Standard Format for Agent Experience Data

@Letta_AI · 9.8K 粉丝 · 86.5K 阅 · 504 赞 · 31 转

07/24 14:07

Introducing trajectory, an open-source package that normalizes coding-agent sessions from @AnthropicAI Claude Code, @OpenAI Codex, @pidotdev, @LangChain deepagents, @openclaw, Letta Code, and other

开源工具数据标准化AI Agent

中文介绍该推文介绍了名为「trajectory」的开源软件包，旨在标准化来自不同 AI 编程代理的会话数据。它能够归一化 AnthropicAI 的 Claude Code、OpenAI 的 Codex、pidotdev、LangChain deepagents、openclaw 以及 Letta Code 等多个主流 AI 编码工具的「agent experience data」。trajectory 的目标是解决 AI 代理数据格式不统一的问题，促进跨平台的数据互操作性与分析，提升开发效率。

Graph Engineering Clearly Explained

@akshay_pachaar · 282.5K 粉丝 · 66.4K 阅 · 515 赞 · 74 转

07/26 02:48

Loop engineering got about six weeks in the spotlight before the timeline moved on. On July 18, Peter Steinberger, the person behind OpenClaw, posted a nine-word question. "Are we still talking loops

架构演进概念解释智能体

中文介绍讨论 AI 智能体架构的演进，从「Loop engineering」转向「Graph Engineering」。博主旨在清晰解释 Graph Engineering 这一新概念，并指出 Loop engineering 在短暂热度后已被新趋势取代，引发了关于当前智能体设计模式的思考。

Why Software Factories Fail

@dexhorthy · 25.8K 粉丝 · 64.9K 阅 · 515 赞 · 50 转

07/25 00:51

or: the harness is not enough Update - the talk version of this post is live on youtube: https://www.youtube.com/watch?v=Ib5GBkD555M i guess we doin loops now We're all racing to put AI coding into production. A lot has

AI开发工程实践失败分析

中文介绍博主探讨了「软件工厂」模式失败的原因，特别是在将 AI 编码引入生产环境的背景下。推文指出，仅仅依靠「harness」（工具或框架）不足以确保成功，暗示当前将 AI 编码落地存在深层挑战。内容可能分析了在生产环境中规模化部署 AI 编码时面临的陷阱和限制，为开发者和团队提供了避免类似错误的反思与警示。

Here's exactly how to build your company brain (in 5 mins)

@DhravyaShah · 61.2K 粉丝 · 56.0K 阅 · 548 赞 · 36 转

07/28 14:16

Every company will have a company brain, whether they believe it or not. This is the bet that I'm making, and I'm constantly seeing very future forward startups come to us for their own setup. What is

企业AI知识库教程

中文介绍博主提出「公司大脑」是企业发展的必然趋势，并分享了「如何准确地在5分钟内构建公司大脑」的实操指南。他观察到许多前瞻性初创公司正积极寻求建立自己的公司大脑系统。该帖子旨在指导企业快速搭建一个整合知识、驱动智能决策的内部AI平台，强调其对未来公司运营的重要性与即时性，提供实用操作建议。

Agent Harness Engineering vs. Loop Engineering vs. Graph Engineering

@beamnxw · 2.6K 粉丝 · 53.5K 阅 · 561 赞 · 92 转

07/25 22:25

A practical guide to the three architecture layers people keep mixing together The confusion is understandable. All three ideas sit around the same model, all three influence reliability, and all

架构对比概念解释实用指南

中文介绍提供智能体架构的实用指南，详细对比并区分了「Agent Harness Engineering」、「Loop Engineering」和「Graph Engineering」这三个常被混淆的概念。博主旨在厘清它们各自的特点及其对模型可靠性的影响，帮助读者理解不同架构层。

Getting the most out of GPT-5.6: Sol, Terra, and Luna

@cerebras · 64.6K 粉丝 · 48.8K 阅 · 550 赞 · 40 转

07/28 03:44

Authors: @0xSero & Zhenwei Gao (@zhennydez) Your Codex subscription now comes with 3 main models, Sol, Terra, and Luna, each independently trained and served, with reasoning dials. Together, they

产品发布模型特性AI工具

中文介绍该帖子宣布，Codex订阅服务已新增三款主要模型：Sol、Terra和Luna。这三款模型均独立训练、部署，并配备了独特的「推理调节器」（reasoning dials）。推文旨在指导用户如何充分利用这些新模型，以优化其在GPT-5.6（或高级AI任务）中的表现，帮助用户根据不同任务需求微调模型行为，从而获得更精准和高效的AI输出。

The new rules of context engineering for Claude 5 models

@trq212 · 318.0K 粉丝 · 48.6K 阅 · 1.2K 赞 · 119 转

07/25 01:45

I’ve written previously about how to best prompt the newest generation of Claude 5 models and work with them iteratively to discover what you want to build. But when you send a message to Claude, the

提示词Claude上下文工程

中文介绍博主分享了针对 Claude 5 模型「上下文工程」的新规则。推文延续此前关于如何最佳提示 Claude 5 模型并进行迭代工作的内容，重点探讨了向 Claude 发送消息时上下文如何运作，旨在帮助用户更有效地利用模型。

Here's exactly how to build your company brain (in 5 mins)

@DhravyaShah · 61.2K 粉丝 · 56.0K 阅 · 7d 曝光 56.0K

07/28 14:16

Here's exactly how to build your company brain (in 5 mins)

Getting the most out of GPT-5.6: Sol, Terra, and Luna

@cerebras · 64.6K 粉丝 · 48.8K 阅 · 7d 曝光 48.8K

07/28 03:44

Getting the most out of GPT-5.6: Sol, Terra, and Luna

Why Software Factories Fail: Benchmarking the new frontier

@dexhorthy · 25.8K 粉丝 · 115.4K 阅 · 7d 曝光 115.4K

07/28 01:43

Why Software Factories Fail: Benchmarking the new frontier

22580: From GPT2 to Kimi3, Explained

@waterloo_intern · 10.4K 粉丝 · 215.4K 阅 · 7d 曝光 215.4K

07/27 23:22

22580: From GPT2 to Kimi3, Explained

Giffgaff携号转网CTExcel UK教程送3镑余额

@realNyarime · 41.9K 粉丝 · 44.8K 阅 · 7d 曝光 44.8K

07/27 22:20

Giffgaff携号转网CTExcel UK教程送3镑余额

Opus 5 is a really bad model

@HarukaKunori · 241 粉丝 · 129.0K 阅 · 7d 曝光 129.0K

07/27 19:07

Opus 5 is a really bad model

PagedAttention & RadixAttention

@jaga_prasanna · 799 粉丝 · 37.9K 阅 · 7d 曝光 37.9K

07/27 17:49

PagedAttention & RadixAttention

我的 55 个 AI视频 Skill 全部开源，这是每一个的用法

@Pluvio9yte · 42.6K 粉丝 · 36.2K 阅 · 7d 曝光 108.5K

07/27 15:49

我的 55 个 AI视频 Skill 全部开源，这是每一个的用法

Codex + Hyperframes + HeyGen +声音克隆：全部开源❗如何零基础开始自媒体变现

@Pluvio9yte · 42.6K 粉丝 · 72.3K 阅 · 7d 曝光 108.5K

07/27 11:22

Codex + Hyperframes + HeyGen +声音克隆：全部开源❗如何零基础开始自媒体变现

Developing MingToon — Bringing My Shader Experiments Together

@kim_raming · 9.4K 粉丝 · 26.4K 阅 · 7d 曝光 26.4K

07/27 08:05

Developing MingToon — Bringing My Shader Experiments Together

More On An Internal OpenAI Model Hacking Into HuggingFace

@TheZvi · 39.0K 粉丝 · 219.4K 阅 · 7d 曝光 219.4K

07/27 03:14

More On An Internal OpenAI Model Hacking Into HuggingFace

Opus 5 Is Here… But NEW Claude Voice Is Even Bigger

07/26 04:28

大模型语音技术产品更新

中文介绍 YouTube 视频指出，「Opus 5」已推出，但新的 Claude 语音功能「Claude Voice」被认为是更重要的进展。视频强调，虽然「Opus 5」已发布，但这一全新的 Claude 语音技术被认为具有更大的影响力。

OpenAI just released Codex Voice (It's basically Jarvis)

07/25 00:09

大模型语音AI产品发布

中文介绍 OpenAI 发布了其名为 Codex Voice 的新产品。该产品被描述为类似电影中「贾维斯」（Jarvis）的人工智能系统，暗示它可能具备先进的语音交互或智能助手功能，代表了AI在自然语言处理和人机互动方面的新进展。

Codex Basically Runs My Company Now. Here’s How.

07/22 06:27

AI应用业务增长Codex

中文介绍 YouTube用户Riley Brown发布视频，展示了他如何将Codex（推测为OpenAI Codex）改造为一个“业务增长机器”。该视频围绕利用AI技术，尤其可能是代码生成能力，来加速企业发展的实际策略展开。

Devin AI: The Full Beginner’s Guide (Better Than Claude Code?)

07/17 02:25

Director by OpenArt

07/17 02:12

Codex New Browser: The Secret Weapon Everyone Should be Using

07/15 21:00

OpenAI Just Merged ChatGPT and Codex. This Changes Everything.

07/13 01:24

Grok 4.5 + Cursor: Full Guide

07/10 01:51

Build Amazing Websites with Claude (Full Guide)

07/07 01:37

What do AI models actually know?

07/24 23:38

AI原理认知科学

中文介绍该视频探讨了人工智能模型实际「知道」什么的核心问题。内容可能涉及AI模型的知识边界、其学习和理解机制与人类认知的异同，以及AI系统如何获取、处理和表达信息。

Why does AI hallucinate?

07/23 23:42

大模型人工智能幻觉

中文介绍这则由Claude发布的YouTube短视频，探讨了人工智能（AI）出现「幻觉」现象的原因。AI幻觉是指大型语言模型在生成文本时，提供看似合理但实际不准确或虚假信息的问题。该视频旨在解释为何AI会生成不符合事实的内容。

How does AI get its character?

07/23 01:05

人工智能AI原理YouTube

中文介绍由Claude在YouTube发布的一则短视频，探讨了人工智能（AI）如何形成其“性格”。视频以此为主题，讨论AI系统在学习和训练过程中发展出独特行为模式的现象。

What is sycophancy?

07/22 02:19

概念解释AI应用社会现象

中文介绍这段来自Claude（YouTube）的短视频，以“什么是阿谀奉承？”为题，旨在清晰阐释「阿谀奉承」（sycophancy）这一概念。视频内容可能涵盖该行为的定义、特征及其在人际互动中的表现形式，帮助观众深入理解这种社会现象的本质。

Making New York City miniature with Claude

07/17 04:56

Build data-driven lesson plans with Claude for Teachers

07/15 23:08

Regenerative beekeeping with Claude

07/15 00:00

Plan smarter with Claude for Teachers

07/14 22:55

The Briefing: AI for Science

07/14 00:02

Building the future of agentic infrastructure

07/11 01:41

What do AI models actually know?

07/24 23:38

AI原理认知科学

Why does AI hallucinate?

07/23 23:42

大模型人工智能幻觉

How does AI get its character?

07/23 01:05

人工智能AI原理YouTube

What is sycophancy?

07/22 02:19

概念解释AI应用社会现象

Making New York City miniature with Claude

07/17 04:56

Build data-driven lesson plans with Claude for Teachers

07/15 23:08

Regenerative beekeeping with Claude

07/15 00:00

Plan smarter with Claude for Teachers

07/14 22:55

The Briefing: AI for Science

07/14 00:02

Building the future of agentic infrastructure

07/11 01:41

Claude Just Revealed AI's Biggest Problem

07/16 23:39

Anthropic Found Something That Shouldn't Exist

07/15 21:58

Minecraft Was Missing One Brilliant Idea

07/12 23:48

DeepSeek's Absolutely Insane AI Speed Hack

07/08 00:33

They Said This Will Never Run In Real Time

07/04 01:19

AI Just Entered A New Era

07/01 13:23

DeepSeek Just Solved AI's Billion Dollar Problem

06/22 23:53

Scientists Found A Better Language For AI Agents

06/19 22:06

They Looked Inside Claude’s AI's Mind. It Got Weird

06/16 23:53

NVIDIA's New Free AI - A Gift To Humanity

06/14 23:27

小孩子照片比较多，目前存在 icloud 2t，有什么什么比较优雅的实体备份方式？

07/28 21:47

16 回复 · Apple 节点

giffgaff 别开 WiFi Calling，我是 6 月份激活的实体卡，早上开了 WiFi Calling，刚收到邮件被封了

07/28 19:47

61 回复 · 程序员节点

从 0 到 1 做方案设计和开发，现在哪个模型比较强

07/28 16:44

7 回复 · 程序员节点

各位的 macOS 菜单栏里放了哪些有用的小工具？

07/28 14:45

21 回复 · Apple 节点

19 年的 MBP 坏了

07/28 14:02

21 回复 · Apple 节点

注册 Apple Developer 求问

07/27 18:17

7 回复 · Apple 节点

如何才能成功注册 Kliq 用于绑定土区

07/27 14:37

13 回复 · Apple 节点

现在 mba 32g+512 有好价吗？

07/27 14:23

6 回复 · Apple 节点

TG api 我用 google Voice 老申请失败

07/24 11:18

17 回复 · Python 节点

北通手柄 Linux USB 断连排查与修复

07/23 15:05

6 回复 · Linux 节点

该源今日无内容。

Recursion Is Lying to You

07/29 04:20

4 points · 3 comments

Pacing the frontier

07/29 04:09

10 points · 1 comments

Hulios: An eBPF-powered, transparent Tor gateway for Linux

07/29 03:54

8 points · 0 comments

Uv 0.12.0

07/29 03:41

64 points · 28 comments

MCP 2026-07-28 Specification: transport going stateless

07/29 02:35

58 points · 21 comments

The iPhone Upgrade Program is being replaced by Apple Upgrade

07/29 01:37

https://www.apple.com/shop/apple-upgrade

Discovering Cryptographic Weaknesses with Claude

07/29 01:22

107 points · 54 comments

Steel Bank Common Lisp version 2.6.7

07/29 01:11

133 points · 43 comments

WOFF 1.0: a milestone on W3C's journey of fonts on the web

07/29 01:05

45 points · 1 comments

Substack writers, you need a website

07/29 00:58

251 points · 143 comments

A walk through of the DeltaNet family of linear attention variants

07/29 00:02

271 points · 111 comments

How Do I Profile eBPF Code?

07/28 23:55

91 points · 6 comments

Show HN: XY – A Fast, composable, GPU-accelerated interactive plotting library

07/28 23:54

85 points · 30 comments

Delayed Gratification – Proud to Be 'Last to Breaking News'

07/28 23:50

178 points · 91 comments

Kimi K3 Architecture Overview and Notes

07/28 23:48

186 points · 21 comments

Zig's Incremental Compilation Internals

07/28 23:46

138 points · 96 comments

So, you want to make a game engine (2023)

07/28 23:36

49 points · 30 comments

Harmony Explained: Progress Towards a Scientific Theory of Music (2012)

07/28 23:20

74 points · 54 comments

Anthropeum – Where in the world, and when, does this human artifact belong?

07/28 23:01

114 points · 32 comments

Now Is the Time to Give LLMs Access to the ACM Digital Library

07/28 23:01

83 points · 54 comments

Stop Killing the Internet: No Digital ID and No Age Verification

07/28 22:58

358 points · 108 comments

Una GPS smart watch – Repairable, USB-C charging, developer-friendly

07/28 22:48

83 points · 60 comments

New HIV vaccine shows unprecedented success in preclinical study

07/28 21:12

459 points · 219 comments

Kimi Linear: An Expressive, Efficient Attention Architecture (2025)

07/28 18:52

248 points · 108 comments

DMARC has been public since 2012 but most company domains still don't enforce it

07/28 18:20

157 points · 98 comments

7.1 Earthquake in Japan

07/28 15:44

756 points · 196 comments

The most advanced robotic servicing satellite–that we know about

07/25 02:39

24 points · 1 comments

The Fabled Flatbreads of Uzbekistan (2015)

07/24 22:43

31 points · 15 comments

How to survive boiling water

07/24 22:19

405 points · 88 comments

Show HN: How far do I have to go to run into 100k people?

07/24 05:33

6 points · 1 comments

v2.1.220

07/25 09:35

What's changed Bug fixes and reliability improvements

版本更新bug修复Claude

中文介绍 Anthropic 旗下的 Claude Code 项目发布了 v2.1.220 版本。此次更新主要内容为错误修复和可靠性改进，旨在提升软件的稳定性和用户体验。

v2.1.219

07/25 01:14

What's changed Added Claude Opus 5 (claude-opus-5), now the default Opus model — 1M context, fast mode at $10/$50 per Mtok Added sandbox.network.strictAllowlist setting to deny non-allowlisted hosts for sandboxed commands without prompting Added DirectoryAdded hook that fires after /add-dir or the S

大模型软件更新安全

中文介绍 Anthropic的Claude-code项目发布v2.1.219更新。此版本引入了Claude Opus 5（claude-opus-5）作为默认Opus模型，具备1M上下文。其快速模式定价为每百万token $10/$50。同时，更新新增“sandbox.network.strictAllowlist”设置，增强沙盒命令的网络安全。

v2.1.218

07/23 05:24

What's changed Changed /code-review to run as a background subagent, so review work no longer fills your conversation and keeps stacked slash commands as its review target Added screen-reader announcements of deleted text for word and line deletions (Option+Delete, Ctrl+W, Cmd+Backspace, Ctrl+U, Ctr

v2.1.217

07/22 05:35

What's changed Added emoji shortcode autocomplete in the prompt input: type :heart: to insert ❤️, or :hea for suggestions — disable with the emojiCompletionEnabled setting Added warnings when transcript writes are failing (e.g. disk full) or when session saving is off due to an inherited environment

v2.1.216

07/21 06:14

What's changed Added sandbox.filesystem.disabled setting to skip filesystem isolation while keeping network egress control Fixed a slowdown in long sessions where message normalization cost grew quadratically with the number of turns, causing multi-second stalls and slow resumes Fixed auto mode deny

v2.1.215

07/19 10:56

What's changed Claude no longer runs the /verify and /code-review skills on its own; invoke them with /verify or /code-review when you want them

v2.1.214

07/18 09:20

What's changed Fixed single-segment dir/** allow rules like Edit(src/**) auto-approving writes to nested dir/ directories anywhere in the tree instead of only /dir Fixed a permission-check bypass affecting commands run in Windows PowerShell 5.1 sessions Fixed Bash permission checks to fail closed on

v2.1.212

07/17 08:26

What's changed /fork now copies your conversation into a new background session (its own row in claude agents) while you keep working; the in-session subagent it used to launch is now /subtask Added claude auto-mode reset to restore the default auto-mode configuration, with a confirmation prompt (pa

v2.1.211

07/16 07:02

07/25 02:27

Release 0.146.0-alpha.7

软件更新开源OpenAI

中文介绍 OpenAI Codex项目发布了Rust语言版本的0.146.0-alpha.7更新。此为该项目的一个alpha阶段版本，通常包含开发中的新功能或修复。

今日主题

今日AI领域呈现出深度创新与行业审慎并存的态势。在模型层面，万亿级参数大模型Kimi K3展现出强大多模态能力，Anthropic模型更在密码学领域发现关键漏洞，凸显AI技术前沿突破；与此同时，以Sam Altman为代表的行业领袖呼吁放缓AI发展，加之AI投资成本令华尔街担忧，AI安全与治理的讨论日益升温，标志着行业正迈向一个更注重可持续性与规制平衡的新阶段。

模型发布/更新

Model Releases 33 篇

Kimi K3 模型发布：2.8万亿参数MoE架构支持100万上下文窗口与原生视觉能力

官方HuggingFace Trending Papers

Kimi K3 是一款拥有 2.8 万亿参数的 MoE（专家混合）模型，其中激活参数达 1040 亿。该模型具备原生视觉能力和 100 万 token 的超长上下文窗口，其核心技术为 Kimi Delta Attention 和 Attention Residuals，旨在显著提升序列间的信息流和处理能力。Kimi K3 的发布，标志着大模型在规模、多模态融合及长上下文理解方面达到新的里程碑，有望在复杂推理和多领域应用中展现强大潜力。

大模型多模态MoE

Anthropic Mythos 模型发现互联网加密算法漏洞

研究聚合The Decoder

Anthropic 公司宣布，其 Claude Mythos Preview 模型成功发现了互联网关键加密算法的漏洞，其中包括针对后量子签名方案 HAWK 的更优攻击方法。令人瞩目的是，该模型在仅 60 小时内、花费约 10 万美元的 API 成本，便完成了人类专家两年多未能发现的工作。这一突破不仅展示了 AI 在安全分析领域的巨大潜力，也提醒我们需警惕 AI 在网络安全攻防两端可能带来的深远影响。

AI安全密码学Anthropic

Airi：自托管AI伴侣项目旨在打造定制化虚拟角色与实时语音聊天

开源项目GitHub Trending

Airi 是一个开源的自托管 AI 伴侣项目，致力于为用户提供私有化、高度可定制的虚拟角色（如「waifu」），并支持实时语音聊天，目标是达到 Neuro-sama 的交互水平。该项目旨在创建一个类似 Grok Companion 的系统，让用户能够完全掌控自己的 AI 互动体验，甚至可能与 Minecraft 等游戏集成。Airi 的推出，满足了用户对个性化、私密 AI 伴侣的需求，并探索了 AI 虚拟角色在娱乐和交互领域的更深层应用。

AI伴侣自托管开源项目

产品发布/更新

Product 33 篇

Andrew Ng 推出 aisuite 项目：统一管理与访问多供应商生成式AI服务

开源项目GitHub Trending

知名 AI 专家 Andrew Ng 推出了开源项目 aisuite，旨在提供一个简洁统一的界面，用于访问和管理多个生成式 AI 供应商服务。该项目通过标准化 API 抽象层，解决了开发者或企业在使用不同大语言模型（LLM）或生成式 AI 平台时面临的接口不一致、集成复杂等问题。aisuite 使开发者能更轻松地比较不同模型、快速切换供应商或构建多模态 AI 应用，极大地简化了 AI 服务的集成与管理。

LLM生成式AIAPI集成

Cerebras Codex 订阅服务新增 Sol、Terra、Luna 三款独立模型

X·KOLX 推文 (AttentionVC)

Cerebras 公司宣布，其 Codex 订阅服务已新增 Sol、Terra 和 Luna 三款主要模型。这三款模型均独立训练、部署，并配备了独特的「推理调节器」（reasoning dials），使用户可以根据不同任务需求微调模型行为，从而获得更精准和高效的 AI 输出。此次更新旨在指导用户如何充分利用这些新模型，以优化其在高级 AI 任务中的表现，为开发者提供了更丰富的选择和更精细的控制能力。

产品发布模型特性AI工具

FlowTask 2.0 平台：面向企业AI智能体的“公司大脑”解决方案

产品榜单Product Hunt

「FlowTask 2.0」是一个专为企业 AI 智能体设计的“公司大脑”平台。它旨在作为 AI 智能体的工作中枢，帮助企业整合并优化其内部的 AI 应用与流程管理。通过提供一个统一的智能操作环境，FlowTask 2.0 解决了企业在部署和管理多个 AI 工具时面临的复杂性问题，助力企业实现更高效的自动化决策和工作流优化，从而提升整体运营效率和竞争力。

AI智能体企业应用管理工具

行业动态

Industry 33 篇

OpenAI CEO Sam Altman 称经历安全事件后准备放缓 AI 发展速度

综合资讯TechCrunch

OpenAI 首席执行官山姆·奥特曼表示，在经历了他「第一次亲身感受到的安全事件」之后，他准备放缓人工智能（AI）发展的速度。此番表态标志着他此前「快速推进AI」立场的显著变化，可能对未来 AI 研发的节奏和策略产生深远影响。这一声明凸显了 AI 安全已成为行业领袖日益关注的核心议题，预示着 AI 发展将进入一个更加审慎和负责的阶段。

Sam AltmanAI安全行业政策

主要 AI 实验室联名呼吁美国政府放缓前沿 AI 发展并加强全球合作

综合资讯The Verge

包括 OpenAI、Anthropic、谷歌、Meta、微软、Mistral 等主要 AI 实验室的员工已联名致函美国政府，呼吁对前沿 AI 发展采取潜在的放缓措施，或至少加快全球合作。这封联名信反映了 AI 行业内部对快速发展可能带来风险的普遍担忧，旨在推动政府制定更完善的监管框架，以确保 AI 技术的安全、负责任发展。此举进一步强调了 AI 治理的紧迫性，以及行业在风险控制方面的共识。

AI政策行业联名监管

AI模型规模七年增长22580倍：博主探讨AI发展是否仅由规模驱动

X·KOLX 推文 (AttentionVC)

博主分析了从 2019 年的 GPT-2 到 2026 年预测的 KimiK3 模型，计算出模型规模在 7 年内惊人地增长了 22,580 倍。推文质疑这种「规模化」是否是衡量 AI 进步的唯一指标，并表示将在工作日志中深入探讨 AI 发展中的其他关键因素。这篇分析旨在超越单纯的参数数量，审视 AI 技术演进的深层驱动力及潜在影响，鼓励行业对 AI 发展进行更全面和深刻的思考。

AI发展模型规模行业分析

技巧与观点

Tips & Takes 33 篇

博主分享“公司大脑”快速构建指南，助企业高效整合知识与智能决策

X·KOLX 推文 (AttentionVC)

博主 Dhravya Shah 提出「公司大脑」是企业发展的必然趋势，并分享了「如何在 5 分钟内准确构建公司大脑」的实操指南。他观察到许多前瞻性初创公司正积极寻求建立自己的公司大脑系统。该帖子旨在指导企业快速搭建一个整合知识、驱动智能决策的内部 AI 平台，强调其对未来公司运营的重要性与即时性，为企业利用 AI 提升效率和竞争力提供了实用操作建议。

企业AI知识管理教程

初学者指南：如何利用 Claude AI 优化 Excel 电子表格操作

大咖博客Riley Brown (YouTube)

YouTube 频道 Riley Brown 发布了一份视频教程，为初学者提供了一份完整指南，详细讲解如何有效利用人工智能模型 Claude 来辅助和优化 Excel 电子表格的操作。该视频内容聚焦于演示 Claude 在数据处理、分析、公式生成等方面的实际应用技巧，帮助用户掌握将 AI 工具与 Excel 结合使用的基本方法。此教程旨在降低 AI 应用门槛，提升个人和企业在日常办公中的数据处理效率。

ClaudeExcelAI应用

awesome-systematic-trading：系统化交易领域精选资源列表

开源项目GitHub Trending

「awesome-systematic-trading」是一个精心策展的资源列表，旨在汇集系统化交易领域内各类优质资料。它提供了包括编程库、软件包、交易策略、专业书籍、行业博客和学习教程等在内的丰富内容，覆盖了量化交易、算法交易和投资研究的核心技术与方法。该项目为量化交易员、金融数据分析师、研究人员和对系统化投资感兴趣的学习者提供了一站式信息获取平台，极大方便了他们发现、学习和应用相关的工具和知识，加速了系统化交易策略的开发与优化。

量化交易资源列表金融科技

今日产品趋势

今天的 AI 产品发布围绕「智能体开发与应用深化」展开，无论是赋能开发者构建、管理 AI 代理的平台，还是将 AI 智能体直接应用于企业营销、客户服务等场景，都显示出 AI 智能体正从概念走向更具实用性和商业价值的落地。同时，多模态能力的拓展和人机协作的深度融合也是今日亮点。

今日必看

Must See 22 款

aisuite — 统一接口，连接多生成式AI供应商

开源项目GitHub Trending

aisuite 项目由知名 AI 专家 Andrew Ng 推出，旨在提供一个简洁统一的界面，用于访问和管理多个生成式 AI 供应商服务。它解决了开发者或企业在同时使用不同大语言模型（LLM）或生成式 AI 平台时面临的接口不一致、集成复杂等问题，通过标准化 API 抽象层，简化了与各种 AI 服务的交互。该项目使开发者能够更轻松地比较不同模型、快速切换供应商或构建多模态 AI 应用。适用于需要集成、测试或管理多个生成式 AI 模型的开发者、研究人员及企业。

LLM生成式AIAPI集成

Lamoom — Claude AI代理应用生态平台

产品榜单Product Hunt

「Lamoom」是一个开创性的平台，允许用户在 Anthropic Claude 的环境中运行并管理 AI 代理应用，同时也为开发者提供了一个销售自己定制化代理应用的 marketplace。该平台旨在构建一个充满活力的 AI 智能体生态系统，解决了开发者在部署和商业化 AI 代理时面临的技术门槛和市场推广难题。通过 Lamoom，用户可以轻松探索、部署和利用各类 AI 代理来自动化任务，而开发者则能专注于创新，并将他们的智能体解决方案触达更广泛的用户群体。这对于推动 AI 代理技术的大规模应用和商业化具有重要意义。

AI应用开发平台智能体

开发者工具

Dev Tools 33 款

book-to-skill — 技术书籍转Claude AI技能

开源项目GitHub Trending

`book-to-skill` 项目致力于将任何技术书籍的 PDF 文档转化为 Anthropic Claude Code AI 的可用「技能」。它通过处理 PDF 内容，使其能被 AI 理解和利用，从而将书籍的知识库无缝集成到开发者的工作流中。这极大地便利了技术内容的学习、快速参考和实际应用，解决了在复杂技术文档中检索信息效率低下的问题。开发者、工程师或任何技术学习者都能通过此工具，将浩瀚的专业书籍变成随时可用的智能助手，提高学习和工作效率。

LLM应用知识管理AI辅助

claude-video — 赋予Claude AI视频理解能力

开源项目GitHub Trending

该项目赋予 Claude AI 模型观看和理解视频的能力。它通过下载视频、提取关键帧和生成文字转录，将处理后的内容提供给 Claude 进行分析。解决了大型语言模型原生不支持视频输入的问题，使用户能利用 Claude 进行视频摘要、内容问答或深度分析。适用于 AI 开发者和视频内容分析场景。

Claude视频分析多模态 AI

FlowTask 2.0 — 企业AI智能体管理平台

产品榜单Product Hunt

「FlowTask 2.0」是一个专为企业级 AI 智能体设计的「公司大脑」平台。它旨在作为一个中心化的工作枢纽，帮助企业无缝整合并优化其内部部署的各类 AI 应用与自动化流程。通过提供统一的管理界面和强大的协调能力，FlowTask 2.0 解决了企业在 AI 智能体碎片化部署、协作效率低下等方面的挑战，确保不同 AI 模块间能高效协作，共同完成复杂业务目标。该平台特别适合那些寻求构建更智能、更敏捷的企业运营体系，并希望最大化其 AI 投资价值的大中型企业。

AI智能体企业应用管理工具

创作与效率

Creative & Productivity 44 款

Growth Opt Playbook — 营销策略优化工具

产品榜单Product Hunt

「Growth Opt Playbook」是一款先进的营销优化工具，旨在帮助营销人员和企业将复杂的营销活动数据转化为可执行的策略。它通过集成 AI 驱动的数据分析能力，深入洞察用户行为、广告效果和市场趋势，从而智能推荐下一步的市场推广方案。该工具解决了传统营销决策依赖经验而非数据的问题，赋能用户精准定位目标受众，优化广告支出，并持续提升营销投资回报率（ROI）。它特别适合需要提升营销效率、精细化运营的中小型企业及大型机构的营销团队。

营销工具数据分析策略制定

ChatBeacon AIX — AI驱动的客户服务解决方案

产品榜单Product Hunt

「ChatBeacon AIX」是一款功能强大的 AI 驱动客户服务解决方案，其核心卖点是能够高效解决高达 87% 的客户在线聊天咨询。该产品旨在通过智能问答、意图识别和自动化工作流，显著提升客户服务效率，同时大幅减少对人工客服的依赖。它解决了企业在处理海量客户咨询时面临的人力成本高、响应速度慢以及服务质量不稳定等痛点。ChatBeacon AIX 适用于各类希望通过自动化提升客户满意度、优化资源配置的企业，尤其是在电商、金融和技术支持等行业。

AI客服客户服务解决方案

Pinery Prose — AI图书合著工具

产品榜单Product Hunt

「Pinery Prose」是一款创新的 AI 图书合著工具，旨在赋能作者和内容创作者与人工智能协同完成书籍创作。该平台的核心功能在于 AI 能够协助生成文本、完善章节结构或提供创意灵感，同时其独特之处在于，每一次 AI 提出的编辑修改都需要用户手动确认批准。这种「人机协作，人主导」的模式，解决了传统 AI 写作工具可能存在的过度自动化、内容难以控制或风格不符的问题，确保作者始终掌握创作主导权。它特别适合需要提高写作效率、克服创作瓶颈的作家、出版商以及任何希望与 AI 共同创作长篇内容的个人或团队。

AI写作内容创作协作工具

Leaping AI — AI代理多天电话/短信营销

产品榜单Product Hunt

「Leaping AI」提供了一套高度智能化的人工智能代理服务，专注于执行多天、大规模的电话和短信营销活动。这些 AI 代理能够模拟真人进行自然语言对话，从初步的客户接触到后续的跟进，实现营销流程的自动化和个性化。该产品解决了传统营销活动中手动沟通效率低下、成本高昂且难以规模化的问题，尤其适用于需要长时间培养潜在客户、进行复杂销售漏斗管理的企业。通过 Leaping AI，企业可以有效拓展客户触达范围，提升转化率，并释放销售团队的人力资源，专注于更具价值的互动。

AI智能体营销自动化通信

新鲜实验

Emerging 22 款

airi — 自托管AI伴侣项目

开源项目GitHub Trending

Airi 是一个自托管的 AI 伴侣项目，旨在创建用户私有化、可定制的虚拟角色（如「waifu」），并支持实时语音聊天，目标是达到 Neuro-sama 的交互水平。它被设计为一个类似 Grok Companion 的系统，让用户能够完全掌控自己的 AI 互动体验，甚至可能与 Minecraft 等游戏集成。该项目支持 Web、macOS 和 Windows 平台，为追求深度个性化和隐私保护的用户提供了一个前沿的 AI 伴侣解决方案，尤其适合对虚拟角色定制和本地运行有需求的技术爱好者。

AI伴侣自托管虚拟角色

SUB/WAVE — 自托管AI DJ广播系统

产品榜单Product Hunt

「SUB/WAVE」是一款极具创意且可自托管的广播系统，其核心亮点在于配备了智能 AI DJ 功能，并支持用户创建和共享一个独特的直播流。该产品旨在为音乐爱好者和内容创作者提供一个高度个性化和可控的在线电台体验。AI DJ 能够根据用户偏好或预设主题智能选择音乐、进行评论，甚至与听众互动，打破了传统电台的局限性。它解决了用户对个性化内容和社区共享的需求，让每个人都能轻松打造自己的专属电台，与朋友或全球听众共享独特的听觉盛宴。

AI应用流媒体广播

→ 查看产品库