Llasa Training
该项目适合需要高性能语音合成解决方案的研究人员和开发者,尤其是那些专注于语音合成技术研究、智能语音助手开发以及语音播报系统开发的团队。它能够帮助用户快速构建和优化语音合成模型,提升开发效率和模型性能。
总访问量: 474,564,576
占比最多地区: US(19.34%)
780
简介
LLaSA_training 是一个基于 LLaMA 的语音合成训练项目,旨在通过优化训练时间和推理时间的计算资源,提升语音合成模型的效率和性能。该项目利用开源数据集和内部数据集进行训练,支持多种配置和训练方式,具有较高的灵活性和可扩展性。其主要优点包括高效的数据处理能力、强大的语音合成效果以及对多种语言的支持。该项目适用于需要高性能语音合成解决方案的研究人员和开发者,可用于开发智能语音助手、语音播报系统等应用场景。
截图
产品特色
支持基于 LLaMA 的语音合成模型训练,提供高效的计算优化方案
兼容多种开源数据集,如 LibriHeavy、Emilia 等,数据总量达 160,000 小时
提供多种训练配置文件(如 ds_config_zero2.json 和 ds_config_zero3.json),满足不同训练需求
支持通过 Slurm 调度系统进行分布式训练,提升训练效率
可在 Hugging Face 上直接使用相关模型,如 Llasa-3B、Llasa-1B 和 Llasa-8B
使用教程
1. 克隆该项目仓库到本地:`git clone https://github.com/zhenye234/LLaSA_training.git`
2. 下载所需的开源数据集,如 LibriHeavy 和 Emilia 等,或准备自己的数据集
3. 根据需求选择合适的配置文件(如 ds_config_zero2.json 或 ds_config_zero3.json)
4. 使用命令 `torchrun --nproc_per_node=8 train_tts.py config.json` 或通过 Slurm 调度系统运行训练脚本
5. 训练完成后,可在 Hugging Face 上直接使用训练好的模型进行语音合成
流量来源
直接访问51.61%外链引荐33.46%邮件0.04%
自然搜索12.58%社交媒体2.19%展示广告0.11%
最新流量情况
月访问量
4.92m
平均访问时长
393.01
每次访问页数
6.11
跳出率
36.20%
总流量趋势图
地理流量分布情况
美国
19.34%
中国
13.25%
印度
9.32%
俄罗斯
4.28%
德国
3.63%
地理流量分布全球图
同类开源产品
MNN LLM Android App
MNN-LLM 是一款高效的推理框架,旨在优化和加速大语言模型在移动设备和本地 PC 上的部署。
模型训练与部署#人工智能
Search R1
Search-R1 是一个强化学习框架,旨在训练能够进行推理和调用搜索引擎的语言模型(LLMs)。
模型训练与部署#自然语言处理
Genprm
GenPRM 是一种新兴的过程奖励模型(PRM),通过生成推理来提高在测试时的计算效率。
模型训练与部署#生成推理
Arthur Engine
Arthur Engine 是一个旨在监控和治理 AI/ML 工作负载的工具,利用流行的开源技术和框架。
模型训练与部署#机器学习
Cohere Command
Cohere Command 是一个高可扩展性的语言模型系列,旨在为企业提供可靠的人工智能解决方案,助力团队专注于重要工作。
模型训练与部署#人工智能
Factorio学习环境
Factorio Learning Environment(FLE)是基于《Factorio》游戏构建的新型框架,用于评估大型语言模型(LLMs)在长期规划、程序合成和资源优化方面的能力。
模型训练与部署#Factorio游戏
Light R1
Light-R1 是一个由 Qihoo360 开发的开源项目,旨在通过课程式监督微调(SFT)、直接偏好优化(DPO)和强化学习(RL)训练长链推理模型。
模型训练与部署#长链推理
Sesame CSM
优质新品
CSM 是一个由 Sesame 开发的对话式语音生成模型,它能够根据文本和音频输入生成高质量的语音。
语音合成#人工智能
Awesome LLM Post Training
Awesome-LLM-Post-training 是一个专注于大型语言模型(LLM)后训练方法的资源库。
模型训练与部署#后训练
替代品
MNN LLM Android App
MNN-LLM 是一款高效的推理框架,旨在优化和加速大语言模型在移动设备和本地 PC 上的部署。
模型训练与部署#人工智能
Search R1
Search-R1 是一个强化学习框架,旨在训练能够进行推理和调用搜索引擎的语言模型(LLMs)。
模型训练与部署#自然语言处理
Arthur Engine
Arthur Engine 是一个旨在监控和治理 AI/ML 工作负载的工具,利用流行的开源技术和框架。
模型训练与部署#机器学习
Factorio学习环境
Factorio Learning Environment(FLE)是基于《Factorio》游戏构建的新型框架,用于评估大型语言模型(LLMs)在长期规划、程序合成和资源优化方面的能力。
模型训练与部署#Factorio游戏
Light R1
Light-R1 是一个由 Qihoo360 开发的开源项目,旨在通过课程式监督微调(SFT)、直接偏好优化(DPO)和强化学习(RL)训练长链推理模型。
模型训练与部署#长链推理
Sesame CSM
优质新品
CSM 是一个由 Sesame 开发的对话式语音生成模型,它能够根据文本和音频输入生成高质量的语音。
语音合成#人工智能
Awesome LLM Post Training
Awesome-LLM-Post-training 是一个专注于大型语言模型(LLM)后训练方法的资源库。
模型训练与部署#后训练
Bytedance Flux
Flux 是由字节跳动开发的一个高性能通信重叠库,专为 GPU 上的张量和专家并行设计。
模型训练与部署#并行计算
Aot
Atom of Thoughts (AoT) 是一种新型推理框架,通过将解决方案表示为原子问题的组合,将推理过程转化为马尔可夫过程。
模型训练与部署#推理框架