会员
众包
新闻
博问
闪存
云市场
所有博客
当前博客
a56爆大奖在线娱乐的博客
a56爆大奖在线娱乐的园子
账号设置
简洁模式
...
退出登录
注册
登录
Hugging Face 博客
The AI community building the future.
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
5
6
7
8
9
10
11
12
13
···
26
下一页
2023年11月16日
使用 PPO 算法进行 RLHF 的 N 步实现细节
摘要:
当下,RLHF/ChatGPT 已经变成了一个非常流行的话题。a56爆大奖在线娱乐们正在致力于更多有关 RLHF 的研究,这篇博客尝试复现 OpenAI 在 2019 年开源的原始 RLHF 代码库,其仓库位置位于 openai/lm-human-preferences。尽管它具有 “tensorflow-1.x”
阅读全文
posted @ 2023-11-16 15:02 HuggingFace
阅读(581)
评论(0)
推荐(1)
编辑
2023年11月15日
个人编程助手: 训练你自己的编码助手
摘要: 在编程和软件开发这个不断演变的领域中,对效率和生产力的追求催生了许多卓越的创新。其中一个显著的创新就是代码生成模型的出现,如 Codex、StarCoder 和 Code Llama。这些模型在生成类似人类编写的代码片段方面表现出惊人能力,显示出了作为编程助手的巨大潜力。 然而,虽然这些预训练模型在
阅读全文
posted @ 2023-11-15 00:21 HuggingFace
阅读(1345)
评论(0)
推荐(4)
编辑
2023年11月13日
Transformers 中原生支持的量化方案概述
摘要: a56爆大奖在线娱乐旨在对 transformers 支持的各种量化方案及其优缺点作一个清晰的概述,以助于读者进行方案选择。 目前,量化模型有两个主要的用途: 在较小的设备上进行大模型推理 对量化模型进行适配器微调 到目前为止,transformers 已经集成并 原生 支持了 bitsandbytes 和 aut
阅读全文
posted @ 2023-11-13 21:26 HuggingFace
阅读(928)
评论(0)
推荐(2)
编辑
2023年11月10日
Hugging Face 在法国联合启动人工智能创业项目!
摘要: Hugging Face、Meta、Scaleway 与法国创业孵化基地 STATION F 合作的人工智能创业项目正式启动 📢🔥 申请截止日期为 12 月 1 日本项目旨在利用开源人工智能的力量来扶持初创公司并推动人工智能创业生态的创新🌪如果你是:👾 一家愿意开发开源模型的人工智能初创企业
阅读全文
posted @ 2023-11-10 09:53 HuggingFace
阅读(39)
评论(0)
推荐(0)
编辑
2023年11月9日
开源模型 Zephyr-7B 发布——跨越三大洲的合作
摘要: 最近a56爆大奖在线娱乐们刚刚发布了新的开源模型 Zephry-7B🪁,这个模型的诞生离不开全球三大洲开源社区的协作 ??。 a56爆大奖在线娱乐们的 CSO Thomas 录了一个视频介绍了它的起源故事: ? 就在几个月前,巴黎的一个新团队发布了他们首个模型: Mistral 7B,这个模型体积小巧但性能强劲,在基准测试中的表现超
阅读全文
posted @ 2023-11-09 01:10 HuggingFace
阅读(566)
评论(1)
推荐(1)
编辑
2023年11月7日
用 bitsandbytes、4 比特量化和 QLoRA 打造亲民的 LLM
摘要: 众所周知,LLM 规模庞大,如果在也能消费类硬件中运行或训练它们将是其亲民化的巨大进步。a56爆大奖在线娱乐们之前撰写的 LLM.int8 博文 展示了a56爆大奖在线娱乐们是如何将 LLM.int8 论文 中的技术通过 bitsandbytes 库集成到 transformers 中的。在此基础上,a56爆大奖在线娱乐们不断努力以不断降低大模型的准入
阅读全文
posted @ 2023-11-07 23:45 HuggingFace
阅读(1087)
评论(0)
推荐(1)
编辑
2023年11月6日
HF Hub 现已加入存储区域功能
摘要: a56爆大奖在线娱乐们在 企业版 Hub 服务 方案中推出了 存储区域(Storage Regions) 功能。 通过此功能,用户能够自主决定其组织的模型和数据集的存储地点,这带来两大显著优势,接下来的内容会进行简要介绍: 法规和数据合规,此外还能增强数字主权 性能提升(下载和上传速度更快,减少延迟) 目前,a56爆大奖在线娱乐们支持
阅读全文
posted @ 2023-11-06 22:52 HuggingFace
阅读(22)
评论(0)
推荐(0)
编辑
2023年11月2日
发布会回放|Gradio 4.0 正式发布!
摘要: Gradio 的目标是使机器学习模型的演示更容易定制和访问,以满足不同用户的需求。在 4.0 正式版的发布活动上,Hugging Face 的 Gradio 团队介绍了自己为了提高机器学习模型的可访问性所做的工作,以及如何创建自定义组件。 Gradio 是一个用于构建机器学习模型演示的工具,任何人都
阅读全文
posted @ 2023-11-02 17:32 HuggingFace
阅读(134)
评论(0)
推荐(1)
编辑
2023年10月28日
实战|如何低成本训练一个可以超越 70B Llama2 的模型 Zephyr-7B
摘要: 每一周,a56爆大奖在线娱乐们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括a56爆大奖在线娱乐们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,a56爆大奖在线娱乐们将其称之为「Hugging News」。快来看看有哪些近期更新吧! 🎉 新的训练方法 Zephyr-7B 模型超越 70B Lla
阅读全文
posted @ 2023-10-28 01:23 HuggingFace
阅读(496)
评论(0)
推荐(0)
编辑
2023年10月26日
长程 Transformer 模型
摘要: Tay 等人的 Efficient Transformers taxonomy from Efficient Transformers: a Survey 论文 a56爆大奖在线娱乐由 Teven Le Scao、Patrick Von Platen、Suraj Patil、Yacine Jernite 和 Vic
阅读全文
posted @ 2023-10-26 22:02 HuggingFace
阅读(82)
评论(0)
推荐(0)
编辑
上一页
1
···
5
6
7
8
9
10
11
12
13
···
26
下一页
公告