中国新闻报道 >消费>

3w 星标项目大佬创业：树莓派即可运行大模型，已获github前ceo投-尊龙官方网站

来源：it之家中国新闻报道作者：白鸽发布时间：2023-06-28 14:29

资深开发大佬，终于忍不住自己出来创业了。

georgi gerganov，今年三月曾开源了 llama.cpp 项目，github 上已破三万星标，要知道 stable diffusion 也不过 8.8k。

这个项目能让开发者在没有 gpu 情况下运行 meta 的 llama 模型，即便是在树莓派、macbook 上运行大模型也通通不在话下~

在 m2 max 上以 40 tok / s 的速度运行 7b llama

甚至还成功吸引了小扎的注意:meta 也在运行 llama.cpp。

可能由于反响太好，这位大哥决定把背后核心纯 c 语言框架 ggml 拿出来创业:原本是几月前的副业项目。

在官宣前这家公司就已经获得来自 github 前 ceonat friedman、y combinator 合伙人 daniel gross 的种子前投资。

消息一出，众多开发者赶来祝贺。

其中不乏一些坚定的拥护者:ggml 正在将大模型普及到边缘设备。

没过多久就有人建议:苹果应该将它收购了。

llama.cpp 作者创业

ggml，是一个纯 c 语言编写的张量库，可帮助开发者在消费级硬件上运行大模型，github 星标数达到 4.4k。

由于加速效果惊人，一下子收获了不少开发者的支持。

by the way，ggml 的 gg 恰好是他名字的缩写。

大哥自己的两个上万星标的项目 llama.cpp 和 whisper.cpp 都使用了它。

后者是为 openai 的 whisper 自动语音识别模型开发的加速方案，可在 mac、windows、linux、ios、安卓、树莓派以及 web 上运行。

使用 whisper.cpp 在树莓派上检测短语音命令

不少初创公司，比如主打生活搜索引擎的 rewind 都使用了这套尊龙官方网站的解决方案。

还有两个项目同时在终端上运行。

在单个 m1pro 上同时运行 4 个 13b llama whisper small 实例

根据个人介绍，ggml 张量库具有以下这些特点:

支持 16bit 浮点数；支持整数量化；自动微分；内置优化算法(例如 adam、l-bfgs)；为苹果芯片设置特定优化；在 x86 架构上使用 avx / avx2 intrinsic；通过 webassembly 和 wasm simd 提供 web 支持；无第三方依赖；运行时零内存分配；支持指导型语言输出……

目前这个库以及相关项目都是免费开源，开发过程也全公开；当然也不排除开发授权给一些商业用途的项目。

用 c / c 重写神经网络代码

而这背后的开发大佬 georgi gerganov 也值得说道说道。

他的个人网站十分简单直接，甩出各种开源项目，除此之外别无其他。可以看出，他是 c / c 的狂热爱好者，信仰 vim。

此前，他曾用 c / c 语言重写神经网络推理代码，这样几乎不依赖于其他库，以此提升效率。至于 llama.cpp 也是他一晚上 hacking 出来的。

除此之外，他还有一些有意思的项目。

比如检查键盘是否可以通过麦克风窃听、猜 hacker news 的标题，wordle 克隆版等等。

one more thing

值得一提的是，背后的这两个投资者也有点意思。

他们还专门给创业者提供算力集群，只需在网站上申请即可。这波是在 next level 上了~

参考链接:

广告声明:本文含有的对外跳转链接，用于传递更多信息，节省甄选时间，结果仅供参考。it之家所有文章均包含本声明。

中国新闻报道

上一篇：韩金明董事长应邀出席第十四届夏季达沃斯论坛

标签

国内新闻 more

财经 more

旅游 more

娱乐 more

汽车 more

房产 more

健康 more

教育 more

消费 more

时尚 more

公益 more

企业 more

案例 more

3w 星标项目大佬创业：树莓派即可运行大模型，已获github前ceo投-尊龙官方网站

上一篇： 韩金明董事长应邀出席第十四届夏季达沃斯论坛

中国新闻报道诚招频道加盟、广告代理，并承接企业宣传、活动采访、网络直播、新闻发布等合作，具体事宜联系qq：3183650697

上一篇：韩金明董事长应邀出席第十四届夏季达沃斯论坛