ColossalChat是由Colossal-AI推出的免费开源版ChatGPT聊天机器人替代品,目前其GitHub项目已斩获26K星标。
作为当今领先的开源大型人工智能模型解决方案,Colossal AI是第一个基于LLaMA预训练模型开源完整RLHF机制的公司,该机制包括监督数据收集、监督微调、奖励模型训练和强化学习微调,并共享ColossalChat——与最初的ChatGPT技术解决方案非常相似的开源项目。
该开源项目包括以下内容:
Demo演示:一个交互式演示,无需注册或加入等待名单即可在线试用训练代码:开源完整的RLHF训练代码,包括70亿和130亿的模型。数据集:开源104K中英文双语数据集。推理:仅需要4GB GPU内存便可进行70亿参数模型的4-bit量化推理。模型权重:在单个服务器上只需少量计算能力即可实现快速复制。Hali是特斯联联合国际轻奢品牌Buttons推出的多模态多智能体协作AI Agent。Hali具备类人思考、长记忆、物理世界感知和多智能体协作四大特点,语义理解准确率超97%,中英文翻译准确率达96%。Hali被设计为用户的智能伴侣,能理解意图、捕捉心理,提供个性化服务,引领智能奢品新趋势。
AI教程资讯
2025-02-06
Agent K v1 0 是华为诺亚方舟实验室与伦敦大学学院团队联合推出的端到端自主数据科学智能体,能自动化、优化和泛化处理多种数据科学任务。Agent K v1 0基于结构化推理和动态记忆管理,在无需人工微调的情况下,从经验中学习、优化决策。
AI教程资讯
2025-02-06
Pixtral Large是法国Mistral AI开源的1240亿参数超大多模态模型,具备前沿级图像理解能力,支持128K上下文,能理解文本、图表和图像。Pixtral Large基于Mistral Large 2开发,拥有1230亿参数的多模态解码器和10亿参数的视觉编码器,在多个基准测试中表现超越其他模型(超过了GPT-4o、Gemini-1 5Pro、Claude-3 5Sonnet、Llama-3 290B等模型),成为目前最强的开源多模态模型。
AI教程资讯
2025-02-06
Qwen2 5-Turbo是阿里推出的先进语言模型,将上下文长度从 128k 扩展到了 1M ,相当于100万个英文单词或150万个汉字。扩展让模型能处理更长的文本,如长篇小说、演讲稿或代码。Qwen2 5-Turbo用高效的推理速度和经济实惠的价格(比 GPT4o-mini便宜),除了 Gemini 外成为目前上下文长度最高的模型,仅通过API接入,为用户提供强大的语言处理能力。
AI教程资讯
2025-02-06