「needle」26M 函数调用模型:让 tool calling 跑在极小设备上

needle

needle 是 cactus-compute 开源的 26M function call model,定位非常有意思:让函数调用模型跑在极小设备上。

现在很多 tool calling 和 agent workflow 默认依赖大模型云端推理,但 needle 走的是端侧小模型路线。它关注的是在更小、更便宜、更低功耗的设备上完成函数选择和调用这类结构化任务。

项目使用 Python 构建,MIT License,主题包含 gemma、gemini、llm、on-device-ai 等,GitHub 上已有接近 2k stars。对端侧 AI、离线 agent、IoT 工具调用场景来说,这个方向很值得观察。

它不追求成为通用聊天大模型,而是把能力集中在 function call 这个刚需环节:小模型负责“选哪个工具、填什么参数”,再交给系统执行。

传送门

https://github.com/cactus-compute/needle

原创文章,如若转载,请注明出处:https://wefound.cc/p/2492.html

(0)
「violin」开源视频翻译 Skill:面向配音、本地化和多语言分发
上一篇 2026年 5月 17日 上午1:00
「MoBrowser App Icon Maker」AI 生成 macOS 图标:三版候选、反复 refine、一键导出 icns
下一篇 2026年 5月 17日 上午1:15

相关推荐