上一篇,我们简要介绍了35个标星上万的github开源项目。
下面,我将从多维度(摘要、网址、版权、编程语言、简介等)进行介绍。😎开始吧!
一、用户界面与交互
聊天机器人界面
Chatbot UI

摘要 开源的 ChatGPT 用户界面。
网址 https://github.com/mckaywrigley/chatbot-ui
版权 MIT
编程语言 TypeScript
简介
项目 chatbot-ui 是一个开源的 ChatGPT 用户界面。这个项目的目标是为 AI 模型提供一个聊天界面。
以下是这个项目的一些主要功能:
- 一键部署:你可以使用 Vercel 或 Docker 快速部署你自己的聊天机器人用户界面。
- 本地运行:你可以在本地运行这个项目,只需要克隆仓库,安装依赖,提供 OpenAI API 密钥,然后运行应用即可。
- 配置:你可以配置一些环境变量,比如 OpenAI API 密钥、API 主机、API 类型、API 版本、Azure 部署 ID、OpenAI 组织 ID、默认模型、默认系统提示、默认温度、Google API 密钥和 Google CSE ID 等。
- 更新:这个项目会随着时间的推移进行更新,你可以期待频繁的改进。
此外,如果你有任何问题,你可以通过 Twitter 联系项目的创建者 Mckay。
Chatbox

摘要 为 GPT-4 / GPT-3.5(OpenAI API)设计的桌面应用程序
网址 https://github.com/Bin-Huang/chatbox
版权 GPL-3.0
编程语言 TypeScript
简介
项目 Chatbox 是一个为 GPT-4 / GPT-3.5(OpenAI API)设计的桌面应用程序,支持 Windows,Mac 和 Linux。这个项目的目标是成为你在桌面上的终极副驾驶员,帮助你更好地利用 GPT 的能力。
以下是这个项目的一些主要功能:
- 更自由和强大的提示能力:这个项目提供了更自由和强大的提示能力,可以帮助你更好地利用 GPT 的能力。
- 数据本地存储:所有的数据都存储在本地,不会丢失。
- 支持 GPT-4 和其他模型:这个项目支持 GPT-4 和其他模型,可以帮助你处理各种任务。
- 支持自定义域代理:这个项目支持自定义域代理,可以帮助你更好地管理你的网络连接。
- 适合团队协作:这个项目适合团队协作,支持在团队内部分享 OpenAI API 资源。
此外,这个项目还提供了一些其他的功能,比如 Markdown 支持、消息引用、单词和令牌估计、夜间模式等。这个项目的用户界面设计符合人体工程学,提供了安装包,无需部署,免费并开源。
ChuanhuChatGPT

摘要 轻快好用的 Web 图形界面。
网址 https://github.com/GaiZhenbiao/ChuanhuChatGPT
版权 GPL-3.0
编程语言 Python
简介
项目 ChuanhuChatGPT 是一个为 ChatGPT/ChatGLM/LLaMA/StableLM/MOSS 等多种大型语言模型(LLM)提供了一个轻快好用的 Web 图形界面。这个工具的目标是让你能够轻松地与这些语言模型进行对话。
以下是这个项目的一些主要特点:
- 多种模式:ChuanhuChatGPT 提供了多种模式,包括流式传输、无限对话、保存对话、预设 Prompt 集、联网搜索、根据文件回答等。
- 渲染功能:ChuanhuChatGPT 支持渲染 LaTeX 公式、渲染表格、代码高亮等。
- 自适应界面:ChuanhuChatGPT 提供了自适应界面,可以根据你的设备和浏览器自动调整界面。
- 支持多种语言模型:ChuanhuChatGPT 支持多种语言模型,包括 ChatGPT、ChatGLM、LLaMA、StableLM、MOSS 等。
- 自定义 API-Host:你可以在 config.json 文件中设置自定义的 API-Host。
此外,这个项目还提供了详细的安装和使用指南,包括如何安装依赖,如何设置 API-Key,如何运行 Web UI 等。
ChatGPT Next Web

摘要 一键拥有你自己的 ChatGPT 网页服务。
网址 https://github.com/Yidadaa/ChatGPT-Next-Web
编程语言 TypeScript
简介
项目 ChatGPT-Next-Web 是一个可以一键部署到 Vercel 上的精心设计的 ChatGPT 网页用户界面。这个项目的目标是让用户能够快速、免费地部署自己的私人 ChatGPT 网页应用。
以下是这个项目的一些主要功能:
- 一键部署:你可以在 1 分钟内使用 Vercel 免费一键部署。
- 隐私优先:所有数据都存储在浏览器本地。
- Markdown 支持:它支持 LaTex、mermaid、代码高亮等 Markdown 功能。
- 响应式设计:它具有响应式设计,支持深色模式和 PWA。
- 快速首屏加载速度:它的首屏加载速度极快(~100kb),支持流式响应。
- 预制角色功能:你可以使用预制角色功能(面具),方便地创建、分享和调试你的个性化对话。
此外,这个项目还支持多国语言,并且有详细的开发和部署指南。如果你想要进行二次开发,或者想要将这个项目部署到你自己的服务器上,你都可以在这个项目的文档中找到详细的步骤。
代码辅助工具
Cursor

摘要 让你与 AI 一起编程而设计的编辑器。
网址 https://github.com/getcursor/cursor
公司 Cursor
简介
项目 Cursor 是一个为了与 AI 一起编程而设计的编辑器。这个编辑器的目标是帮助开发者更高效地编程。
以下是这个项目的一些主要功能:
- 聊天:你可以与一个类似于 ChatGPT 的机器人进行聊天,这个机器人可以看到你当前的文件。
- 编辑:你可以要求 AI 改变一块代码,然后看到编辑的内联差异。
- 调试:你可以将鼠标悬停在语法错误上,自动修复它们。
- 编写:你可以从简短的英文描述生成整个代码库。
此外,这个项目还提供了详细的使用指南,包括如何下载和试用这个编辑器。
二、内容处理与理解
文档处理
babyagi

摘要 一个 AI 驱动的任务管理系统。
网址 https://github.com/yoheinakajima/babyagi
版权 MIT
编程语言 Python
简介
项目 babyagi 是一个基于 Python 的开源项目,它是一个 AI 驱动的任务管理系统。这个系统使用 OpenAI 和向量数据库(如 Chroma 或 Weaviate)来创建、优先级排序和执行任务。这个系统的主要思想是基于先前任务的结果和预定义的目标来创建任务。然后,该脚本使用 OpenAI 的自然语言处理(NLP)能力根据目标创建新任务,并使用 Chroma/Weaviate 存储和检索任务结果以获取上下文。
以下是这个项目的一些主要功能:
- 任务管理:这个系统可以创建、优先级排序和执行任务,这对于任务管理非常有用。
- 使用 OpenAI 和向量数据库:这个系统使用了 OpenAI 和向量数据库(如 Chroma 或 Weaviate),可以提供高质量的任务管理体验。
- 创建新任务:这个系统可以根据目标和先前任务的结果创建新任务。
- 存储和检索任务结果:这个系统使用 Chroma/Weaviate 存储和检索任务结果,这对于获取任务的上下文非常有用。
此外,这个项目还提供了详细的使用指南,包括如何克隆仓库、安装所需的包、设置环境变量、运行脚本等。
GPT-4 & LangChain

摘要 用于处理大型 PDF 文档的 GPT4 和 LangChain 聊天机器人
网址 https://github.com/mayooear/gpt4-pdf-chatbot-langchain
编程语言 TypeScript
简介
项目 gpt4-pdf-chatbot-langchain 是一个开源的项目,用于创建一个可以处理大型 PDF 文件的 GPT-4 和 LangChain 聊天机器人。这个项目的目标是让用户能够通过聊天机器人方便地查询和获取 PDF 文件中的信息。
以下是这个项目的一些主要功能:
- 处理大型 PDF 文件:这个项目可以处理多个大型 PDF 文件,将 PDF 文件的内容转化为可以被聊天机器人理解和查询的形式。
- 使用 GPT-4 和 LangChain:这个项目使用了 GPT-4 和 LangChain 这两个强大的 AI 技术,可以提供高质量的聊天体验。
- 使用 Pinecone 存储嵌入:这个项目使用 Pinecone 作为向量存储,用于存储 PDF 文件的嵌入,这样可以在后续的查询中快速地获取相似的文档。
- 开发和运行:这个项目提供了详细的开发和运行指南,包括如何设置环境变量、如何将 PDF 文件转化为嵌入、如何运行应用等。
此外,这个项目还提供了一个教程视频,如果你对这个项目感兴趣,你可以观看这个视频来了解更多的信息。
privateGPT

摘要 通过 GPT 的强大能力,100%私密地与您的文档进行互动,无数据泄漏
网址 https://github.com/imartinez/privateGPT
版权 Apache-2.0
编程语言 Python
简介
项目 privateGPT 是一个开源的项目,用于创建一个可以在本地环境中与你的文档进行交互的 GPT 聊天机器人。这个项目的目标是让用户能够在保证数据完全私密的情况下,使用 GPT 的能力处理文档。
以下是这个项目的一些主要功能:
- 本地处理文档:这个项目可以在本地环境中处理你的文档,无需互联网连接,所有数据都不会离开你的执行环境。
- 使用 GPT 和 LangChain:这个项目使用了 GPT 和 LangChain 这两个强大的 AI 技术,可以提供高质量的聊天体验。
- 处理 PDF 文件:这个项目可以处理多个大型 PDF 文件,将 PDF 文件的内容转化为可以被聊天机器人理解和查询的形式。
- 使用向量数据库:这个项目使用了向量数据库(如 Chroma 或 Weaviate)来存储和检索文档的嵌入,这样可以在后续的查询中快速地获取相似的文档。
此外,这个项目还提供了详细的使用指南,包括如何设置环境变量、如何运行脚本等。
ChatGPT Retrieval Plugin

摘要 帮助你使用自然语言查询来搜索和检索个人或组织的文档。
网址 https://github.com/openai/chatgpt-retrieval-plugin
版权 MIT
公司 OpenAI
编程语言 Python
简介
项目 ChatGPT Retrieval Plugin 是一个插件,它可以帮助你使用自然语言查询来搜索和检索个人或组织的文档。简单来说,你可以像问问题一样来查找你需要的文档或者文档中的内容。
以下是这个项目的一些主要功能:
- 自主生成和查询文档嵌入:此插件利用 OpenAI 的文本嵌入模型来创建文档嵌入,并使用后端的向量数据库来储存和查询这些嵌入。这是一个开源的,可自我托管的解决方案。开发者可以部署他们自己的检索插件并将其注册到 ChatGPT。此插件支持多种向量数据库供应商,开发者可以根据他们的需求进行选择。
- 为 ChatGPT 提供记忆功能:这个插件的另一个特性是它可以为 ChatGPT 提供记忆功能。通过使用插件的 upsert 端点,ChatGPT 可以将对话中的片段保存到向量数据库中,以供将来引用(只有在用户提示的情况下)。这一功能使得聊天体验更具上下文意识,因为 ChatGPT 可以记住并检索过去的对话信息。
这个插件不仅可以帮助你更方便地搜索和管理你的文档,还可以提升你与 ChatGPT 的互动体验。
openai-translator

摘要 基于 ChatGPT API 的划词翻译浏览器插件和跨平台桌面端应用
网址 https://github.com/openai-translator/openai-translator
版权 AGPL-3.0
公司 openai-translator
编程语言 TypeScript
简介
项目 openai-translator 是一个基于 ChatGPT API 的划词翻译浏览器插件和跨平台桌面端应用。这个项目的目标是让用户能够方便地进行划词翻译和全文翻译。
以下是这个项目的一些主要功能:
- 划词翻译:你可以在浏览器中划选文本,然后使用这个插件进行翻译。
- 全文翻译:你可以使用这个插件进行全文翻译,这对于阅读外语文章非常有用。
- 跨平台桌面端应用:这个项目不仅是一个浏览器插件,还是一个跨平台的桌面端应用,你可以在 Windows、macOS 和 Linux 上使用这个应用。
- 支持多种语言:这个项目支持多种语言的翻译,可以满足不同用户的需求。
- 使用 OpenAI API:这个项目使用了 OpenAI API,可以提供高质量的翻译结果。
此外,这个项目还提供了详细的使用指南,包括如何安装和配置这个插件,如何使用这个插件进行翻译等。
论文阅读
GPT 学术优化 (GPT Academic)

摘要 为 GPT/GLM 提供图形交互界面,特别优化论文阅读润色体验。
网址 https://github.com/binary-husky/gpt_academic
版权 GPL-3.0
编程语言 Python
简介
项目 gpt_academic,是由 GitHub 用户 binary-husky 创建的。它的主要目标是为 ChatGPT/GLM 提供一个图形交互界面,特别优化了论文阅读和润色的体验。这个项目的设计是模块化的,支持自定义快捷按钮和函数插件。
以下是这个项目的一些主要功能:
- 代码块和表格显示:它可以显示代码块和表格,这对于理解和分析代码非常有用。
- TeX 公式双显示:它可以同时显示 TeX 公式的原始形式和渲染形式,这对于理解和使用数学公式非常有用。
- 项目剖析和自译解:它可以剖析 Python 和 C++ 等项目,并提供自译解功能,这对于理解和学习代码非常有用。
- 论文翻译和总结:它可以翻译和总结 PDF/LaTex 论文,这对于理解和学习论文非常有用。
- 并行问询多种 LLM 模型:它支持并行问询多种大型语言模型,这可以提高问询的效率和质量。
- 支持本地模型:它支持清华大学的 chatglm 等本地模型,这可以提高模型的访问速度和稳定性。
此外,这个项目还兼容复旦大学的 MOSS,llama,rwkv,盘古,newbing,claude 等其他模型和工具。
ChatPaper

摘要 使用 ChatGPT 来总结 arXiv 上的论文。
网址 https://github.com/kaixindelele/ChatPaper
编程语言 Python
简介
项目 ChatPaper 使用 ChatGPT 来总结 arXiv 上的论文。该项目的目标是全流程加速科研,包括论文总结、润色、审稿和审稿回复。
ChatPaper 提供了一系列工具,包括:
- ChatPaper:通过 ChatGPT 实现对论文进行总结,帮助科研人进行论文初筛。
- ChatReviewer:利用 ChatGPT 对论文进行优缺点分析,提出改进建议。
- ChatImprovement:利用 ChatGPT 对论文初稿进行润色、翻译等。
- ChatResponse:利用 ChatGPT 对审稿人的提问进行回复。
- ChatGenTitle:利用百万 arXiv 论文元信息训练出来的论文题目生成模型,根据论文摘要生成合适题目。
这些工具都是免费的,代码开源,大家可以放心使用。关于 API 如何获取,首先你得有一个没有被封的 ChatGPT 账号,然后获取 Api Key,填入即可。
此外,该项目还提供了一些使用技巧,包括:
快速刷特定关键词的论文,每篇文章需要花一分钟,阅读时间差不多一分钟。
跟踪领域最新论文,或者关注其他领域的论文,可以批量生成总结,最大可生成 1000 篇(如果你能等得及的话)。虽然 Chat 可能有瞎编的成分,但是在规范化提问的框架下,它的主要信息是保熟的。数字部分需要大家重新去原文检查。找到好的文章之后,可以精读这篇文章。
项目还提供了详细的使用步骤和常见报错解决方案,方便用户使用。
图像处理
DragGAN

摘要 用于实现在生成图像流形上的交互式点基操作。
网址 https://github.com/XingangPan/DragGAN
简介
项目 DragGAN 是一个开源的项目,用于实现在生成图像流形上的交互式点基操作(Interactive Point-based Operations)。这个项目的目标是让用户能够通过拖拽操作直接在生成图像流形上进行编辑。
以下是这个项目的一些主要功能:
- 交互式操作:你可以通过拖拽操作直接在生成图像流形上进行编辑。
- 生成图像流形:这个项目的核心是生成图像流形,这是一种可以生成各种各样的图像的数学结构。
- SIGGRAPH 2023:这个项目的代码将在 2023 年的 SIGGRAPH 会议上发布。
此外,这个项目还提供了一个 GIF 动画,展示了如何通过拖拽操作直接在生成图像流形上进行编辑。
Segment Anything

摘要 提供了使用 SegmentAnything 模型(SAM)进行推理的代码。
网址 https://github.com/facebookresearch/segment-anything
版权 Apache-2.0
公司 Meta Research
编程语言 Jupyter Notebook
简介
项目 Segment Anything 是由 Facebook AI Research (FAIR) 开发的一个模型,它可以根据输入的提示(如点或框)生成高质量的对象掩膜,也可以用于生成图像中所有对象的掩膜。这个模型被训练在一个包含 11 百万图像和 11 亿掩膜的数据集上,对各种分割任务有很强的零样本性能。
以下是这个项目的一些主要功能:
- 生成对象掩膜:这个模型可以根据输入的提示(如点或框)生成高质量的对象掩膜,也可以用于生成图像中所有对象的掩膜。
- 强大的零样本性能:这个模型被训练在一个包含 11 百万图像和 11 亿掩膜的数据集上,对各种分割任务有很强的零样本性能。
- 模型检查点:这个项目提供了模型检查点的下载链接,你可以下载这些检查点来使用这个模型。
- ONNX 导出:这个模型的轻量级掩膜解码器可以被导出为 ONNX 格式,这样就可以在任何支持 ONNX 运行时的环境中运行,比如在浏览器中。
此外,这个项目还提供了详细的使用指南,包括如何安装和使用这个模型,如何导出 ONNX 模型,如何使用命令行生成掩膜等。
语音处理
Bark

摘要 基于 Transformer 的文本到音频模型。
网址 https://github.com/suno-ai/bark
版权 MIT
公司 Suno
编程语言 Jupyter Notebook
简介
项目 bark 是由 Suno 创建的一个基于 Transformer 的文本到音频模型。这个模型可以生成非常逼真的多语言语音,以及其他音频,包括音乐、背景噪音和简单的音效。模型还可以产生非语言的交流方式,如笑声、叹息和哭声。
以下是这个项目的一些主要功能:
- 生成音频:它可以从文本生成音频,这对于语音合成非常有用。
- 支持多种语言:它支持多种语言,并能自动从输入文本中确定语言。
- 音乐生成:它可以生成所有类型的音频,包括音乐。
- 语音预设:它支持 100 多种语音预设,跨越支持的语言。
- 生成更长的音频:默认情况下,generate_audio 函数可以很好地处理大约 13 秒的口语文本。
此外,这个项目还提供了一个命令行界面,可以通过命令行生成音频。
SoftVC VITS

摘要 歌唱声音转换模型。
网址 https://github.com/svc-develop-team/so-vits-svc
版权 BSD-3-Clause
公司 MoeVoiceConversion
编程语言 Python
简介
项目 SoftVC VITS 是一个歌唱声音转换模型,使用 SoftVC 内容编码器提取源音频的语音特征,然后将这些向量直接输入到 VITS 中,而不是转换为基于文本的中间形式,从而保留了音高和语调。
声码器被改为 NSF HiFiGAN,以解决声音中断的问题。这个项目的目标是让开发者喜欢的动漫角色能够唱歌,任何涉及真人的事情都是偏离开发者意图的。
这个项目是一个开源的、离线的项目,所有的功能都需要用户自己训练模型。
三、语言模型与平台
Alpaca-LoRA

摘要 在消费级硬件上进行指令调整的 LLaMA 模型。
网址 https://github.com/tloen/alpaca-lora
版权 Apache-2.0
编程语言 Jupyter Notebook
简介
项目 alpaca-lora 是一个开源的项目,用于在消费级硬件上进行指令调整的 LLaMA 模型。这个项目的目标是提供一个与 text-davinci-003 类似质量的 Instruct 模型,可以在树莓派(用于研究)上运行,代码也可以轻松扩展到 13b、30b 和 65b 的模型。
以下是这个项目的一些主要功能:
- 训练代码:提供了训练代码,可以在单个 RTX 4090 上在几小时内运行。
- 下载和推理:提供了一个脚本,用于下载和推理基础模型和 LoRA,以及 LoRA 权重本身。
- 微调:为了便宜和高效地微调,他们使用了 Hugging Face 的 PEFT 和 Tim Dettmers 的 bitsandbytes。
- 本地设置:提供了详细的本地设置和训练指南。
- 推理:提供了一个文件,该文件从 Hugging Face 模型中心读取基础模型和 LoRA 权重,并在指定的输入上运行 Gradio 接口进行推理。
此外,这个项目还提供了 Docker 设置和推理的指南,如果你想要在 Docker 中运行这个项目,你可以参考这些指南。
ChatGLM-6B

摘要 开源双语对话语言模型。
网址 https://github.com/THUDM/ChatGLM-6B
版权 Apache-2.0
公司 THUDM
编程语言 Python
简介
项目 ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。这个模型使用了和 ChatGPT 相似的技术,针对中文问答和对话进行了优化。
以下是这个项目的一些主要特点:
- 双语支持:ChatGLM-6B 支持中英双语,经过约 1T 标识符的中英双语训练,可以生成符合人类偏好的回答。
- 模型量化技术:结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。
- 参数微调:为了方便下游开发者针对自己的应用场景定制模型,项目同时实现了基于 P-Tuning v2 的高效参数微调方法。
- 开源社区合作:ChatGLM-6B 开源模型旨在与开源社区一起推动大模型技术发展,恳请开发者和大家遵守开源协议。
- 安全性:尽管模型在训练的各个阶段都尽力确保数据的合规性和准确性,但由于 ChatGLM-6B 模型规模较小,且模型受概率随机性因素影响,无法保证输出内容的准确性,且模型易被误导。
ChatGLM-6B 是一个强大的对话语言模型,它可以帮助你进行中英双语的对话,同时也提供了一些高级功能,如模型量化和参数微调,使得你可以根据自己的需求来定制模型。
Dolly

摘要 由 Databricks 开发的大型语言模型。
网址 https://github.com/databrickslabs/dolly
版权 Apache-2.0
公司 Databricks Labs
编程语言 Python
简介
项目 Dolly 是一个由 Databricks 开发的大型语言模型,基于 Databricks 机器学习平台进行训练,可以用于商业用途。Dolly 模型基于 pythia-12b,经过约 15k 条由 Databricks 员工生成的指令/响应微调记录进行训练,这些记录涵盖了 InstructGPT 论文中的多个能力领域,包括头脑风暴、分类、封闭 QA、生成、信息提取、开放 QA 和摘要等。尽管 Dolly v2-12b 并不是最先进的模型,但它展示出了令人惊讶的高质量指令执行行为,这是其基础模型所不具备的。
Dolly 模型的主要特点包括:
- 指令执行:Dolly 模型可以理解和执行用户的指令,这使得它可以在聊天中帮助用户完成各种任务。
- 两阶段训练:Dolly 模型的训练包括两个阶段。第一阶段是预训练阶段,使用大约 500 万个图像-文本对进行训练。第二阶段是微调阶段,使用一个小而高质量的数据集进行训练,以提高生成的可靠性和整体可用性。
- 安装和使用:这个项目提供了详细的安装和使用指南,包括如何开始使用这个项目,如何设置环境变量和 API 密钥,如何设置数据库,如何设置后端和前端等。
Dolly 是一个强大的语言模型,它可以帮助你更好地理解和执行各种指令。
gpt4free

摘要 去中心化 AI 行业,提供多个反向工程的语言模型 API。
网址 https://github.com/xtekky/gpt4free
版权 GPL-3.0
编程语言 Python
简介
项目 gpt4free 的目标是去中心化 AI 行业,提供多个反向工程的语言模型 API。它包括了多个反向工程的语言模型 API,如 GPT-4、GPT-3.5 等。这个项目的目标是去中心化 AI 行业,使得更多的人可以自由地使用这些强大的语言模型。
这个项目的主要功能包括:
- 提供了多个反向工程的语言模型 API,如 GPT-4、GPT-3.5 等。
- 提供了一个 GUI,使得用户可以更方便地使用这些 API。
- 提供了 Docker 支持,用户可以使用 Docker 来运行这个项目。
- 提供了详细的安装和使用指南,包括如何安装依赖,如何设置代理,如何使用 GUI,如何使用 Docker 等。
这个项目是一个强大的工具,可以帮助你更方便地使用各种语言模型。
llama.cpp

摘要 将 Facebook 的 LLaMA 模型移植到 C/C++
网址 https://github.com/ggerganov/llama.cpp
版权 MIT
编程语言 C
简介
项目 llama.cpp 是 Facebook 的 LLaMA 模型的 C/C++ 实现。
以下是一些关于这个项目的主要信息:
- 项目的主要目标是在 MacBook 上使用 4 位整数量化运行 LLaMA 模型。
- 它是一个纯 C/C++ 实现,没有依赖项。
- 优化了 Apple silicon,通过 ARM NEON 和 Accelerate 框架进行优化。
- 在 CPU 上运行。
- 支持 OpenBLAS/Apple BLAS/ARM Performance Lib/ATLAS/BLIS/Intel MKL/NVHPC/ACML/SCSL/SGIMATH 等在 BLAS 中的更多内容。
- 支持 cuBLAS 和 CLBlast。
这个项目最初在一个晚上被快速实现,但由于许多贡献,现在已经有了显著的改进。这个项目主要用于教育目的,并作为为 ggml 库开发新功能的主要场所。
支持的平台包括 Mac OS、Linux、Windows(通过 CMake)和 Docker。支持的模型包括 LLaMA、Alpaca、GPT4All、Chinese LLaMA / Alpaca、Vigogne(法语)、Vicuna、Koala、OpenBuddy(多语言)、Pygmalion 7B / Metharme 7B 和 WizardLM。
此外,还提供了 Python、Go、Node.js、Ruby 和 C#/。NET 的绑定。
MiniGPT-4

摘要 通过先进的大型语言模型增强视觉语言理解。
网址 https://github.com/Vision-CAIR/MiniGPT-4
版权 BSD-3-Clause
公司 Vision CAIR Research Group, KAUST
编程语言 Python
简介
项目 MiniGPT-4 是一个开源的视觉-语言理解模型,它使用了先进的大型语言模型来增强视觉-语言理解能力。这个模型使用了 Vicuna 语言模型,并使用了一种名为 BLIP-2 的视觉编码器。
以下是这个项目的一些主要特点:
- 视觉-语言理解:MiniGPT-4 可以理解和生成关于图像的描述,这使得它可以在聊天中谈论你的图像。
- 两阶段训练:MiniGPT-4 的训练包括两个阶段。第一阶段是预训练阶段,使用大约 500 万个图像-文本对进行训练。第二阶段是微调阶段,使用一个小而高质量的数据集进行训练,以提高生成的可靠性和整体可用性。
- 安装和使用:这个项目提供了详细的安装和使用指南,包括如何准备代码和环境,如何准备预训练的 Vicuna 权重,如何准备预训练的 MiniGPT-4 检查点,如何在本地启动演示,如何进行训练等。
MiniGPT-4 是一个强大的视觉-语言理解模型,它可以帮助你更好地理解和生成关于图像的描述。
MOSS

摘要 来自复旦大学的开源工具增强对话式语言模型
网址 https://github.com/OpenLMLab/MOSS
版权 Apache-2.0
公司 OpenLMLab
编程语言 Python
简介
项目 MOSS 是一个开源的多目标优化算法库。这个库的目标是为研究者和工程师提供一个方便的平台,以便他们可以更容易地实现和比较多目标优化算法。
这个库包括以下几个部分:
- 算法:包括经典的多目标优化算法,如 NSGA-II、NSGA-III、MOEA/D 等,以及一些最新的算法。
- 问题:包括许多经典的测试问题,如 ZDT、DTLZ、WFG 等。
- 度量:包括一些常用的多目标优化度量,如 IGD、HV 等。
- 可视化:提供了一些可视化工具,以便用户可以更直观地理解和比较算法的性能。
- 并行计算:支持并行计算,以提高算法的运行效率。
这个库是用 Python 编写的,使用了 PyTorch 框架。
StableLM: Stability AI Language Models

摘要 由 Stability AI 开发的一系列语言模型。
网址 https://github.com/Stability-AI/StableLM
版权 Apache-2.0
公司 Stability AI
编程语言 Jupyter Notebook
简介
项目 StableLM 是由 Stability AI 开发的一系列语言模型,这些模型的目标是提供稳定的 AI 语言模型。这个项目将持续更新新的检查点。
以下是这个项目的一些主要功能:
- StableLM 语言模型:这个项目包含了 Stability AI 的 StableLM 语言模型,这些模型可以处理各种任务。
- 新的数据集:这个项目使用了新的数据集,这个数据集基于 The Pile,包含了 1.5 万亿个令牌,大约是 The Pile 大小的 3 倍。
- 微调模型:这个项目还包含了微调模型,这些模型使用了 Stanford Alpaca 的过程,以及五个最近的对话代理数据集。
- 模型规模:这个项目包含了不同规模的模型,包括 3B、7B、15B、30B、65B 和 175B。
此外,这个项目还提供了详细的快速启动指南,包括如何使用 Hugging Face hub 上的 StableLM 模型,如何使用代码片段开始与 StableLM-Tuned-Alpha 聊天等。
Stanford Alpaca: An Instruction-following LLaMA Model

摘要 用于训练斯坦福的 Alpaca 模型和生成数据的代码和文档。
网址 https://github.com/tatsu-lab/stanford_alpaca
版权 Apache-2.0
公司 Tatsu's shared repositories
编程语言 Python
简介
项目 stanford_alpaca 是由 Stanford University 的 Tatsu Lab 开源的项目,它的目标是构建和分享一个能够遵循指令的 LLaMA 模型。这个项目包含了用于微调模型的 52K 数据,生成数据的代码,微调模型的代码,以及从发布的权重差异中恢复 Alpaca-7B 权重的代码。
以下是这个项目的一些主要功能:
- 遵循指令的 LLaMA 模型:这个项目旨在构建和分享一个能够遵循指令的 LLaMA 模型,这个模型可以处理各种任务。
- 数据和代码:这个项目包含了用于微调模型的 52K 数据,生成数据的代码,微调模型的代码,以及从发布的权重差异中恢复 Alpaca-7B 权重的代码。
- 权重恢复:这个项目提供了从发布的权重差异中恢复 Alpaca-7B 权重的方法,你可以使用这个方法来获取 Alpaca-7B 的权重。
此外,这个项目还提供了详细的使用指南,包括如何运行代码,如何微调模型,如何处理内存溢出问题,如何恢复 Alpaca 权重等。
AI 助手/平台
Auto-GPT: An Autonomous GPT-4 Experiment

摘要 一个试图使 GPT-4 完全开源的实验性项目。
网址 https://github.com/Significant-Gravitas/Auto-GPT
版权 MIT
公司 Significant Gravitas
编程语言 Python
简介
项目 Auto-GPT 是一个开源的实验项目,旨在使 GPT-4 完全自主。这个程序由 GPT-4 驱动,将 LLM "思考"链接在一起,自主地实现你设定的任何目标。作为 GPT-4 完全自主运行的首个例子之一,Auto-GPT 推动了 AI 可能性的边界。
以下是这个项目的一些主要特点:
- 互联网访问:用于搜索和信息收集。
- 长期和短期记忆管理:帮助 AI 更好地理解和执行任务。
- GPT-4 实例:用于文本生成。
- 访问流行的网站和平台:使 AI 可以获取更多的信息和资源。
- 文件存储和总结:使用 GPT-3.5 来存储和总结文件。
- 插件扩展性:你可以安装插件来增强 Auto-GPT 的功能。
此外,这个项目还提供了详细的安装和使用指南,包括如何开始使用这个项目,如何获取 OpenAI API 密钥,如何下载最新的发布版本,如何安装和配置插件等。
AgentGPT

摘要 在浏览器中组装、配置和部署自主 AI 代理的开源项目。
网址 https://github.com/reworkd/AgentGPT
版权 GPL-3.0
公司 Reworkd.ai
编程语言 TypeScript
简介
项目 AgentGPT 是一个开源的平台,允许你在浏览器中组装、配置和部署自主的 AI 代理。你可以为你的自定义 AI 命名,并让它开始执行任何你可以想象的目标。AI 代理将通过思考要执行的任务、执行它们并从结果中学习来尝试达到目标。
以下是这个项目的一些主要特点:
- 自主的 AI 代理:你可以在浏览器中组装、配置和部署自主的 AI 代理。
- 自定义 AI:你可以为你的自定义 AI 命名,并让它开始执行任何你可以想象的目标。
- 学习和执行任务:AI 代理将通过思考要执行的任务、执行它们并从结果中学习来尝试达到目标。
- 技术栈:这个项目使用了一系列的技术,包括 Nextjs 13、Typescript、FastAPI、Next-Auth.js、Prisma & SQLModel、Planetscale、TailwindCSS + HeadlessUI、Zod + Pydantic 和 Langchain。
此外,这个项目还提供了详细的使用指南,包括如何开始使用这个项目,如何设置环境变量和 API 密钥,如何设置数据库,如何设置后端和前端等。
GPT4All

摘要 一个生态系统,训练于大量干净助手数据的开源聊天机器人集合,包括代码、故事和对话。
网址 https://github.com/nomic-ai/gpt4all
版权 MIT
公司 Nomic AI
编程语言 Python
简介
项目 gpt4all 是一个开源的生态系统,用于训练和部署在消费级 CPU 上本地运行的强大和定制的大型语言模型。这个生态系统的目标很简单 - 成为任何个人或企业都可以自由使用、分发和构建的最好的指令调整助手式语言模型。
以下是这个项目的一些主要功能:
- 本地运行:你可以在你的家用桌面上本地运行任何 GPT4All 模型。
- 多种语言绑定:它提供了 Python、Typescript、GoLang 和 C#### 的官方绑定。
- 贡献:GPT4All 欢迎开源社区的贡献、参与和讨论。
- 技术报告:他们提供了关于 GPT4All 的技术报告。
此外,如果你在下游项目中使用了这个仓库、模型或数据,他们希望你能引用它。
FastChat

摘要 用于训练、提供服务和评估大型语言模型的开放平台。
网址 https://github.com/lm-sys/FastChat
版权 Apache-2.0
公司 LMSYS
编程语言 Python
简介
项目 FastChat 是一个开放平台,用于训练、服务和评估大型语言模型,特别是基于聊天机器人的模型。它的核心功能包括:
- 提供了一些最新的模型(如 Vicuna, FastChat-T5)的权重、训练代码和评估代码。
- 提供了一个分布式的多模型服务系统,包括 Web UI 和与 OpenAI 兼容的 RESTful API。
- 介绍了一些新的功能和发布,如 Chatbot Arena,这是一个让大型语言模型进行对战的平台。
此外,这个项目还提供了详细的安装和使用指南,包括如何使用命令行接口进行推理,如何使用 Web GUI 进行服务,如何使用 API,如何进行评估和微调等。
JARVIS

摘要 由微软开发的一个系统,用于将大型语言模型(LLMs)与机器学习社区连接起来。Paper: https://arxiv.org/pdf/2303.17580.pdf
网址 https://github.com/microsoft/JARVIS
简介
项目 JARVIS 是由微软开发的一个系统,用于将大型语言模型(LLMs)与机器学习社区连接起来。这个项目的目标是通过语言作为接口,将大量的 AI 模型连接起来,以解决复杂的 AI 任务。
以下是这个项目的一些主要功能:
- 任务规划:使用 ChatGPT 来分析用户的请求,理解他们的意图,并将它们拆解成可能的可解决的任务。
- 模型选择:为了解决计划的任务,ChatGPT 根据它们的描述选择在 Hugging Face 上托管的专家模型。
- 任务执行:调用并执行每个选定的模型,并将结果返回给 ChatGPT。
- 响应生成:最后,使用 ChatGPT 集成所有模型的预测,并生成响应。
此外,这个项目还提供了详细的使用指南,包括如何设置环境变量、如何运行脚本等。
TaskMatrix

摘要 由 Microsoft 开源的项目,它将 ChatGPT 和一系列的视觉基础模型连接起来。
网址 https://github.com/microsoft/TaskMatrix
版权 MIT
公司 Microsoft
编程语言 Python
简介
项目 TaskMatrix 是一个由 Microsoft 开源的项目,它将 ChatGPT 和一系列的视觉基础模型连接起来,使得在聊天过程中可以发送和接收图像。这个项目的目标是通过利用 ChatGPT 的广泛理解和视觉基础模型的深度知识,构建一个能够处理各种任务的 AI。
以下是这个项目的一些主要功能:
- 连接 ChatGPT 和视觉基础模型:这个项目将 ChatGPT 和一系列的视觉基础模型连接起来,可以在聊天过程中发送和接收图像。
- 处理各种任务:这个项目可以处理各种任务,包括图像编辑、图像生成、图像描述、图像到线条的转换、线条到图像的转换、图像到边缘检测的转换、边缘检测到图像的转换、图像到涂鸦的转换、涂鸦到图像的转换、图像到姿势的转换、姿势到图像的转换、图像到分割的转换、分割到图像的转换、图像到深度的转换、深度到图像的转换、图像到法线的转换、法线到图像的转换、视觉问题回答等。
- 模板:这个项目提出了模板的概念,模板是一个预定义的执行流程,可以帮助 ChatGPT 组装涉及多个基础模型的复杂任务。
此外,这个项目还提供了详细的快速启动指南,包括如何克隆仓库、安装所需的包、设置环境变量、启动 TaskMatrix 等。
Dalai

摘要 让你可以在本地机器上运行 LLaMA 和 Alpaca。
网址 https://github.com/cocktailpeanut/dalai
编程语言 CSS
简介
项目 Dalai 是一个简单的工具,使你能够在本地机器上运行 LLaMA 和 Alpaca。这个项目的目标是让你能够轻松地在你的电脑上运行这两个强大的语言模型。
以下是这个项目的一些主要特点:
- 跨平台:Dalai 可以在 Linux、Mac 和 Windows 等所有主流操作系统上运行。
- 内存需求:只要你的电脑不是非常旧,Dalai 应该可以在上面运行。具体的内存需求取决于你要运行的模型的大小。
- 磁盘空间需求:Alpaca 和 LLaMA 模型需要大量的磁盘空间。具体的磁盘空间需求取决于你要安装的模型的大小。
- 快速开始:这个项目提供了详细的安装和使用指南,包括如何安装依赖,如何安装模型,如何运行 Web UI 等。
- API:Dalai 也是一个 NPM 包,你可以使用它来编程安装模型,本地请求模型,运行 Dalai 服务器,编程请求远程 Dalai 服务器等。
这个项目是一个强大的工具,可以帮助你更方便地使用 LLaMA 和 Alpaca 这两个强大的语言模型。
其他
Mr. Ranedeer AI Tutor

程序员 Jush
摘要 基于 GPT-4 的 AI 辅导工具,提供了个性化的学习体验。
网址 https://github.com/JushBJJ/Mr.-Ranedeer-AI-Tutor
简介
项目 Mr。 Ranedeer AI Tutor 是一个基于 GPT-4 的 AI 辅导工具,提供了个性化的学习体验。你可以根据自己的需求和兴趣定制学习体验。
以下是这个项目的一些主要特点:
- 个性化学习:你可以调整知识深度以匹配你的学习需求,定制你的学习风格、沟通方式、语气和推理框架,创建专为你量身定制的最佳 AI 辅导员。
- 命令支持:AI 辅导员支持多种命令,如请求测试以评估你的知识和理解,更新你的 AI 辅导员配置/偏好,创建基于你的偏好的课程计划,搜索特定信息等。
- 多语言支持:通过编辑 Mr Ranedeer 文件或使用 /language [lang] 命令,你可以改变 Mr Ranedeer 对你说的语言。
- 适用性:推荐使用 ChatGPT Plus 订阅并配合 GPT-4 或以上模型使用。不推荐使用 GPT-3.5 或 GPT-4 API(成本较高)。
这个项目是一个强大的学习工具,可以帮助你更好地学习和理解各种知识。
Twitter's Recommendation Algorithm

摘要 Twitter 的推荐算法的源代码。
网址 https://github.com/twitter/the-algorithm
版权 AGPL-3.0
公司 Twitter
编程语言 Scala
简介
项目 The Algorithm 是 Twitter 的推荐算法的源代码。这个算法是一套服务和任务,负责在所有 Twitter 产品表面(例如,为你的时间线、搜索、探索、通知)提供推文和其他内容的推送。
以下是这个项目的一些主要特点:
- 推荐算法:Twitter 的推荐算法可以为用户提供个性化的推文和其他内容。
- 多种组件:这个项目包括了多种组件,包括数据处理、模型训练、软件框架等。
- 产品表面:这个项目目前包括了为你的时间线和推荐通知两个产品表面。
- 开源:Twitter 的推荐算法是开源的,这意味着任何人都可以查看和修改这个算法的源代码。
- 贡献:Twitter 邀请社区提交 GitHub 问题和拉取请求,以提出对推荐算法的改进建议。他们正在开发工具来管理这些建议,并将更改同步到他们的内部存储库。
这个项目是一个强大的推荐系统,它可以帮助 Twitter 提供个性化的推文和其他内容。
carrot

摘要 众多免费好用的 ChatGPT 镜像站点,当前 100+站点
网址 https://github.com/xx025/carrot
简介
项目 Carrot 是一个免费的 ChatGPT 站点列表。这个项目的目标是为用户提供大量的免费和好用的 ChatGPT 镜像站点,目前已经收录了 100+站点。
这个列表包含了各种各样的 ChatGPT 站点,每个站点都有详细的描述和链接,方便用户直接访问。这些站点包括 Poe.com、Theb.ai、Jinshutuan.com、Anzz.top、Ai-node.com、Gptforlove.com、Newstop.asia、Chatgptdddd.com、Xjai.cc、Chatplus.plus、20200.cn、Aidutu.cn、Promptboom.com、Aiyunos.top、Infiniteai.chat、Qdymys.cn、Kebakeba.com、Betai55.uk、T66.ltd、Character.ai、Peo.icu、Gpt90.com、Cytsee.com、Skybyte.me、Bnu120.space、Nb8.ltd、Xiami.monster、Aichatos.top、Cutim.top、Dreamtrend.net、Scorpii.net、Forwardminded.xyz、Ailake.top、Hz-it-dev.com、154.12.55.27、1ai.fun、Gpt6.lol、Xboat.cc 等等。
每个站点都有一些标注,比如 "使用稳定,推荐"、"最近更新"、"免费使用"、"需要登陆或密码"、"需国际网络进行访问" 等等,这些标注可以帮助用户快速了解每个站点的特点和使用条件。
这个项目是开源的,任何人都可以参与到这个项目中来,分享站点、报告站点失效、标注错误等等。这个项目的目标是为用户提供最全面、最准确、最实用的 ChatGPT 站点列表。
注意,现在有广告,请注意甄别。
后记
35个项目,圆满结束。
你可以先阅读这份介绍,之后期待详细的项目实践!
对了,欢迎交流和反馈哦~