# datawhale_spark_sdk **Repository Path**: bardwang/datawhale_spark_sdk ## Basic Information - **Project Name**: datawhale_spark_sdk - **Description**: sdk的目标时简化讯飞关于web socket的调用，并封装成python对象。我们希望学习者使用sdk后，可以从官方demo的几十行代码化简成几行代码。 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 2 - **Created**: 2025-05-14 - **Last Updated**: 2025-05-14 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # SDK调用方式 ## 1. 安装SDK ```bash pip install dwspark-2025.0.1-py3-none-any.whl -i https://pypi.tuna.tsinghua.edu.cn/simple --default-timeout=600 ``` ## 2. 加载配置 ```python from dwspark.config import Config # 加载系统环境变量：SPARKAI_UID、SPARKAI_APP_ID、SPARKAI_API_KEY、SPARKAI_API_SECRET config = Config() # 自定义key写入 config = Config('14****93', 'eb28b****b82', 'MWM1MzBkOD****Mzk0') ``` ## 3.调用模型 ```python # SDK引入模型 from dwspark.models import MultiLang # 日志 from loguru import logger ''' 多语种大模型 ''' # 模拟问题 message = [{"role": "system", "content": "あなたはとても専門的な日本語の国語の先生で、文才が華麗です。"},{"role": "user", "content": '100字の作文を書いてください。'}] logger.info('----------批式调用对话----------') model = MultiLang(config, stream=False) logger.info(model.generate(message) logger.info('----------流式调用对话----------') model = MultiLang(config, stream=True) for r in model.generate_stream(message): logger.info(r) logger.info('done.') ''' 语音合成模型 ''' from dwspark.models import Text2Audio text2audio = Text2Audio(config) result = text2audio.generate("你好，这里是datawhale团队，请问有什么可以帮你的？", "./demo.mp3") logger.info(f'-------语音合成结果：{result}-------') ''' 中英识别模型 ''' from dwspark.models import Audio2Text model = Audio2Text(config) result = model.recognize('./demo.mp3') logger.info(f'识别结果：{result}') ''' 图片生成大模型 ''' from dwspark.models import Text2Picture model = Text2Picture(config) img_path = model.generate("请你生成一幅鲸鱼水墨画", "D://") logger.info(f'生成图片位置：{img_path}') ''' 一句话语音克隆 ''' logger.info('----------批式调用----------') model = VoiceSynthesis(conf, stream=False) params_with_training = { 'text': "欢迎使用讯飞星火认知大模型。", 'model_name': "new_model", 'audio_path': './dwspark/voice/test.wav', # 音频需要宝子们根据要求录制参见“./dwspark/voice/语音文本.txt” # 'force_train': True, # Force retraining 'output_path': './new_output.mp3', 'voice_model_config': 'voice_models.json' # Add the voice_model_config to params } # Uncomment to run training and synthesis result = model.generate(params_with_training) logger.info(f"Training and synthesis result: {result}") ``` # 模型列表 | 模型名称 | 调用方式 | |--------|-----------------------------------------------------------------------------------------------| | 多语种大模型 | model = ChatModel(config, stream=False)
model.generate([dict(role="user", content='100字の作文を書いてください。')]) | | 语音合成模型 | model = Text2Audio(config)
result = text2audio.generate("你好，这里是datawhale团队，请问有什么可以帮你的？", "./demo.mp3") | | 中英识别模型 | model = Audio2Text(config)
result = model.recognize('./demo.mp3') | | 图片生成大模型 | model = Text2Picture(config)
img_path = model.generate("请你生成一幅鲸鱼水墨画", "D://") |