淘宝店铺网站建设,注册公司入口官网,宿迁网站设计,什么企业时候做网站—
date: 2024/01/08
— 吴恩达和Langchain合作开发了JavaScript 生成式 AI 短期课程#xff1a;《使用 LangChain.js 构建 LLM 应用程序》
大家好#xff0c;欢迎收看第六期机器学习周刊
本期介绍10个内容#xff0c;涉及Python、机器学习、大模型等,目录如下#xff…—
date: 2024/01/08
— 吴恩达和Langchain合作开发了JavaScript 生成式 AI 短期课程《使用 LangChain.js 构建 LLM 应用程序》
大家好欢迎收看第六期机器学习周刊
本期介绍10个内容涉及Python、机器学习、大模型等,目录如下
1、哈佛大学机器学习课2、第一个 JavaScript 生成式 Al 短期课程3、一个地理相关的Python库4、电脑本地运行大模型聊天软件,支持中文5、Chatbot Ul 2.0 发布6、文本嵌入的74年历史7、LangChain v0.1.0发布8、一个由Google开发的机器学习工具9、Mixtral 8x7B 论文发布10、斯坦福大学开发出一个几乎不会产生幻觉的模型: WikiChat
1、哈佛大学机器学习课
课程简介https://pll.harvard.edu/course/data-science-machine-learning
注册地址https://www.edx.org/learn/machine-learning/harvard-university-data-science-machine-learning 首先强烈推荐一下质量上乘完全免费的哈佛大学机器学习课程
2024年度课程开始了目前有两个时段可选 1月9日到6月20日 4月18日到12月19日
授课老师是哈佛大学生物统计学教授拉斐尔·伊里扎里感兴趣可以去edX注册了
2、第一个 JavaScript 生成式 AI 短期课程 地址 https://deeplearning.ai/short-courses/build-llm-apps-with-langchain-js/
吴恩达和Langchain合作开发了JavaScript 生成式 AI 短期课程《使用 LangChain.js 构建 LLM 应用程序》
课程简介如下 GitHub 最近报告称 JavaScript 再次成为世界上最流行的编程语言。为了支持 Web 开发人员探索和开发生成式 AI我们刚刚推出了一个新的 JavaScript 短期课程由 LangChainAI 的创始工程师 Hacubu 教授。在使用 LangChain.js 构建 LLM 应用程序中您将学习人工智能开发中常见的元素包括 (i) 使用数据加载器从 PDF、网站和数据库等常见来源提取数据 (ii) 提示用于提供 LLM 上下文 (iii) 支持 RAG 的模块例如文本分割器以及与向量存储的集成 (iv) 使用不同的模型来编写不特定于供应商的应用程序 (v) 解析器提取并格式化输出以供下游代码处理 我对这门课非常感兴趣但是deeplearning官网还没有字幕学起来非常困难
已经有up搬运并配了机翻字幕但是感觉很多地方翻译的不是很准确
所以我准备一边学习一边翻译并上传但是这个字幕翻译工作还是蛮费功夫的可能进度不会很快
感兴趣的同学可以关注一下https://www.bilibili.com/video/BV1Te411m7ys 3、一个地理相关的Python库
地址https://gist.github.com/alexgleith/dc49156aab4b9270b0a0f145bd7fa0ce
推荐一个地理相关的Python库
2 个 Python 库、6 行代码和大约 15 秒的时间就可以从世界任何地方加载卫星数据 4、电脑本地运行大模型聊天软件支持中文
地址https://github.com/janhq/jan
官网jan.ai/ Jan 是 ChatGPT 的一个开源替代品最近在GitHub上非常火爆。它能够在电脑上100% 离线运行支持Nvidia GPU Apple M。
提供众多开源 AI 模型下载每次对话选择一个模型后自动切换很方便。
Jan 能在任何硬件上运行从个人电脑Linux、Windows、MacOS到多 GPU 集群Jan 支持通用架构
Nvidia GPUs (快速)Apple M 系列 (快速)Apple IntelLinux DebianWindows x64 有X友做了测试支持中文效果不错 5、Chatbot UI 2.0 发布
地址https://github.com/mckaywrigley/chatbot-ui
最近 Chatbot UI 2.0发布了这是一个面向所有人的开源AI聊天界面。
它不仅支持OpenAI、Claude的API还支持Gemini、Mistral、Perplexity API、本地Ollama安装的模型。
目前Google 的 Gemini API是免费了感兴趣可以申请后结合这个工具使用。
关于Gemini我之前写过一篇文章详细地介绍了玩法叫板GPT-4的Gemini我做了一个聊天网页可图片输入附教程 6、文本嵌入的74 年历史
地址https://jina.ai/news/the-1950-2024-text-embeddings-evolution-poster/
JinaAI绘制的这张高清PNG海报记录了文本嵌入自1950年至今的历史展示过去 74 年的突破性演变。
网页中还提供了丰富的参考资料每个技术里程碑都附带一个可供探索的资源列表。 7、LangChain v0.1.0
地址 https://blog.langchain.dev/langchain-v0-1-0/
LangChain是大模型世界最重要的工具之一本周LangChain 发布了0.1稳定版完全向后兼容同时提供 Python 和 JavaScript并在功能和文档方面都进行了改进。 可观察性构建复杂的LLM应用程序很困难。为了最好地进行调试需要知道所采取的确切步骤以及每个步骤的输入/输出。通过与LangSmith的紧密集成LangChain拥有一流的可观察性
↔️ 集成近700个集成无论你想使用什么技术堆栈LangChain都支持 可组合性使用 LangChain 表达式语言可以轻松且有趣创建任意链为您带来数据编排框架的所有优势 流式传输我们投入了大量资金来确保使用 LangChain 表达式语言创建的所有链以一流的方式支持流式传输 - 包括中间步骤的流式传输 输出解析让LLM以某种格式返回信息是使其执行操作的关键。 检索为 RAG 添加先进且可用于生产的方法包括文本分割、检索和索引管道 工具使用代理代理集合决定采取什么操作工具集合定义工具的简单方法 8、Teachable Machine一个由Google开发的机器学习工具
地址https://teachablemachine.withgoogle.com
Google 开发机器学习工具Teachable Machine它允许用户快速、简单地创建自己的机器学习模型而无需专业知识或编程技能。
你可以用它来教电脑识别图片、声音或人的动作。
使用这个工具的步骤很简单
1、收集数据你可以上传图片、录制声音或动作视频来作为训练数据。
2、训练模型用这些数据来训练你的模型然后测试它能否正确识别新的图片、声音或动作。
3、导出模型完成训练后你可以下载这个模型或者上传到网上用在其他项目中。
Teachable Machine提供了多种方式来创建机器学习模型非常灵活和用户友好。
1、使用文件或实时捕捉示例用户可以选择上传已有的图片、音频文件作为数据也可以直接通过电脑的摄像头或麦克风实时录制视频、声音作为训练数据。
2、可以在本地完成训练用户有选项不通过网络发送或处理数据。所有操作包括数据的收集、模型的训练和应用都可以在用户自己的电脑上完成不需要将摄像头或麦克风收集的数据发送到互联网上。这对于隐私保护是非常重要的特别是当处理敏感信息时。
3、Teachable Machine”生成的模型是真实的TensorFlow.js模型可以在任何运行JavaScript的地方工作。此外还可以将模型导出到不同的格式以便在其他地方使用如Coral、Arduino等。
9、Mixtral 8x7B 论文发布
论文https://arxiv.org/abs/2401.04088
Mixtral官网关于MoE的介绍https://mistral.ai/news/mixtral-of-experts/
本周另一个在X上刷屏的事件前一个是LangChain v0.1.0的发布是Mixtral 8x7B 论文发布。
Mixtral模型发布已经一个月了Mixtral 8x7B 如此令人兴奋的原因在于它探索了一种新的架构范例即“专家混合”方法与大多数 LLMs 所遵循的方法形成鲜明对比。尽管这种方法并不新鲜但尚未在 LLM 领域得到大规模证明。然而Mixtral 论文表明Mixtral 8x7B 在各种基准测试中与更大的模型例如 Llama 2 70B 和 GPT-3.5相比具有良好的性能。 什么是专家混合 (MoE) 方法 MoE 方法是一种机器学习技术结合了多个专家模型的优势来解决问题。与结合所有模型结果的集成技术相比在 MoE 中仅使用一名或少数专家来进行预测。 这种方法有两个主要组成部分 • 路由器决定对于给定输入信任哪个专家以及如何权衡每个专家对于特定输入的结果。 • 专家专门研究问题不同方面的个体模型。 在 Mixtral 的案例中有八位专家其中两位是被选中的。 10、斯坦福大学开发出一个几乎不会产生幻觉的模型WikiChat
GitHubhttps://github.com/stanford-oval/WikiChat 论文https://arxiv.org/abs/2305.14292 在线体验https://wikichat.genie.stanford.edu
大模型的通病是幻觉问题也即一本正经地胡说八道。来自斯坦福的研究人员发布了WikiChat——被称为首个几乎不产生幻觉的聊天机器人
WikiChat基于英文维基百科信息当它需要回答问题时会先在维基百科上找到相关的、准确的信息然后再给出回答保证给出的回答既有用又可靠。
模型在新的基准测试中获得了97.3%的事实准确性而相比之下GPT-4的得分仅为66.1%。 这个模型可以在线体验不过遗憾的是它不支持中文而且试用次数非常有限。 顺便说一句斯坦福不但开源了模型还开源了上面这个聊天应用ovalchat的代码
https://github.com/stanford-oval/ovalchat