AI工具-基于funasr打造离线语音转写工具

ASR工具构建

HAH-M

980人浏览 · 2024-09-05 16:40:17

HAH-M · 2024-09-05 16:40:17 发布

【说在前面】

该用例基于魔塔社区中发布的预训练模型和funasr构建。仅支持单声道、16KHz、16位采样wav语音文件的离线转写。
过程中没有用到onnx模型
不支持多线程的并发，但是可以基于多进程实现并发
asr工具构建过程中一定要加载vad，否则推理过程中内存会被撑爆

【预训练模型】

所有预训练模型均可在魔塔社区下载

asr：iic/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch
vad：iic/speech_fsmn_vad_zh-cn-16k-common-pytorch
punc：iic/punc_ct-transformer_zh-cn-common-vocab272727-pytorch
spk：iic/speech_campplus_sv_zh-cn_16k-common

工具构建

话不多说，直接上代码：

class ASRModel:
    def __init__(self):
        self.local_model_path = cfg["model"]["local_path"]
        self.input_batch_size = cfg["model"]["input_batch_size"] if "input_batch_size" \
                                                                    in cfg["model"] else 10
        # ASR
        self.model = self.local_model_path + "speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch"
        # voice activity detection
        self.vad_model = self.local_model_path + "speech_fsmn_vad_zh-cn-16k-common-pytorch"
        # punctuation detection
        self.punc_model = self.local_model_path + 'punc_ct-transformer_zh-cn-common-vocab272727-pytorch'
        # speaker separate
        self.spk_model = self.local_model_path + 'speech_campplus_sv_zh-cn_16k-common'
        self.asr_model = None

    def load_model(self):
        self.asr_model = AutoModel(model=self.model,
                                   vad_model=self.vad_model,
                                   punc_model=self.punc_model,
                                   spk_model=self.spk_model,
                                   device="cuda:0")

    def generate(self, wav_file):
        if len(wav_file) < 0:
            return ""
        else:
            if self.asr_model is not None:
                asr_output = self.asr_model.generate(input=wav_path, batchsize=self.input_batch_size)
                return asr_output

上述核心代码基于funasr构建。可以根据自身需求自由组合vad、punc和spk。

技术共进，成长同行——讯飞AI开发者社区

更多推荐

AI赋能：智能电网的未来革命

智能电网通过传感器、智能电表和物联网设备收集海量数据，包括用电量、电压、电流、频率等实时信息。这些数据为人工智能提供了丰富的输入源，使其能够进行预测、优化和自动化决策。人工智能技术在智能电网中的应用主要体现在负荷预测、故障检测、能源调度和分布式能源管理等方面。结合图神经网络，可以分析电网拓扑结构中的故障传播路径，快速定位问题源头。能源调度是智能电网的核心问题，需要在满足需求的同时最小化成本和碳排放

讯飞AI开发者社区

AI赋能智能家居：30字揭秘能耗管理黑科技

随着算法进步和硬件发展，未来的智能家居系统将实现更高精度的能耗管理和更自然的用户交互。人工智能模型可以识别能耗 patterns，预测未来能耗需求，并自动调整设备运行参数。深度学习算法在处理非结构化数据方面表现出色，能够从复杂的能耗数据中提取有价值的信息。智能家居设备产生的大数据为能耗管理提供了丰富的信息源。环境模拟智能家居系统的状态变化，智能体通过不断尝试和学习，找到最小化能耗的最优策略。这种方

讯飞AI开发者社区

智能客服革命：大数据重塑客户体验

传统模式下，客服中心依赖人工经验和有限的数据分析，难以应对海量客户请求和复杂问题。大数据分析技术的引入，能够从历史交互数据、客户行为模式、服务流程等多个维度挖掘价值信息，实现精准预测、智能分配和流程优化。随着人工智能技术的进步，客服中心的大数据分析将更加智能化。客户服务中心的数据来源多样，包括通话记录、聊天日志、邮件、社交媒体互动等。利用机器学习算法，可以预测客户可能遇到的问题类型、服务时长和满意