模型
TTSVoice module-attribute
用于 TTSModelSettings voice 枚举的可导出类型
TTSModelSettings dataclass
TTS 模型的设置。
源代码位于 src/agents/voice/model.py
voice class-attribute instance-attribute
voice: TTSVoice | None = None
TTS 模型要使用的语音。如果未提供,将使用相应模型的默认语音。
transform_data class-attribute instance-attribute
用于转换 TTS 模型数据的函数。如果您希望结果音频流已经以特定形状的数据呈现,这将很有用。
instructions 类属性 实例属性
instructions: str = "You will receive partial sentences. Do not complete the sentence just read out the text."
用于 TTS 模型的指令。如果您希望控制音频输出的语调,这将很有用。
text_splitter class-attribute instance-attribute
text_splitter: Callable[[str], tuple[str, str]] = (
get_sentence_based_splitter()
)
用于将文本拆分为块的函数。如果您希望在将其发送到 TTS 模型之前将文本拆分为块,而不是等待处理整个文本,这将很有用。
TTSModel
基础: ABC
可以将文本转换为音频输出的文本到语音模型。
源代码位于 src/agents/voice/model.py
run abstractmethod
run(
text: str, settings: TTSModelSettings
) -> AsyncIterator[bytes]
给定一个文本字符串,生成 PCM 格式的音频字节流。
参数
| 名称 | 类型 | 描述 | 默认 |
|---|---|---|---|
文本
|
str
|
要转换为音频的文本。 |
required |
返回值
| 类型 | 描述 |
|---|---|
AsyncIterator[bytes]
|
PCM 格式的音频字节的异步迭代器。 |
源代码位于 src/agents/voice/model.py
StreamedTranscriptionSession
基础: ABC
音频输入的流式转录。
源代码位于 src/agents/voice/model.py
transcribe_turns abstractmethod
生成文本转录的流。每个转录都是对话中的一轮。
只有在调用 close() 后,此方法才应返回。
STTModelSettings dataclass
语音到文本模型的设置。
源代码位于 src/agents/voice/model.py
STTModel
基础: ABC
可以将音频输入转换为文本的语音到文本模型。
源代码位于 src/agents/voice/model.py
transcribe abstractmethod async
transcribe(
input: AudioInput,
settings: STTModelSettings,
trace_include_sensitive_data: bool,
trace_include_sensitive_audio_data: bool,
) -> str
给定一个音频输入,生成文本转录。
参数
| 名称 | 类型 | 描述 | 默认 |
|---|---|---|---|
input
|
AudioInput
|
要转录的音频输入。 |
required |
settings
|
STTModelSettings
|
用于转录的设置。 |
required |
trace_include_sensitive_data
|
bool
|
是否在跟踪中包含敏感数据。 |
required |
trace_include_sensitive_audio_data
|
bool
|
是否在跟踪中包含敏感音频数据。 |
required |
返回值
| 类型 | 描述 |
|---|---|
str
|
音频输入的文本转录。 |
源代码位于 src/agents/voice/model.py
create_session abstractmethod async
create_session(
input: StreamedAudioInput,
settings: STTModelSettings,
trace_include_sensitive_data: bool,
trace_include_sensitive_audio_data: bool,
) -> StreamedTranscriptionSession
创建一个新的转录会话,您可以将音频推送到该会话,并接收文本转录的流。
参数
| 名称 | 类型 | 描述 | 默认 |
|---|---|---|---|
input
|
StreamedAudioInput
|
要转录的音频输入。 |
required |
settings
|
STTModelSettings
|
用于转录的设置。 |
required |
trace_include_sensitive_data
|
bool
|
是否在跟踪中包含敏感数据。 |
required |
trace_include_sensitive_audio_data
|
bool
|
是否在跟踪中包含敏感音频数据。 |
required |
返回值
| 类型 | 描述 |
|---|---|
StreamedTranscriptionSession
|
一个新的转录会话。 |
源代码位于 src/agents/voice/model.py
VoiceModelProvider
基础: ABC
语音模型提供商的基接口。
模型提供商负责根据名称创建语音到文本和文本到语音模型。