faq.md
1 ### 1. 程序报告“找不到配置文件”或“xxxxx需要配置xxxxx API密钥。”我该如何解决? 2 3 这是一个常见的设置问题。可能发生这种情况的原因有几个: 4 5 1. **文件位置或名称不正确:** 6 7 * 程序需要一个名为`config.toml`的配置文件。确保您没有意外地将其命名为`config.toml.txt`。 8 * 此文件必须放置在`config`文件夹内。工作目录的正确结构应为: 9 ``` 10 /── config/ 11 │ └── config.toml 12 └── krillinai.exe(您的可执行文件) 13 ``` 14 * **对于Windows用户:** 建议将整个软件目录放在不在C:驱动器上的文件夹中,以避免潜在的权限问题。 15 16 2. **API密钥配置不完整:** 17 18 * 应用程序需要为大型语言模型(用于翻译)、语音服务(用于转录和语音合成)和tts服务分别配置。 19 * 即使您使用OpenAI进行所有操作,您也必须在`config.toml`文件的不同部分填写密钥。查找`llm`部分、`transcribe`部分、`tts`部分,并填写相应的API密钥和其他所需信息。 20 21 ### 2. 我收到包含“yt-dlp错误”的错误。该怎么办? 22 23 此错误指向视频下载器的问题,通常与您的网络或下载器的版本有关。 24 25 * **网络:** 如果您使用代理,请确保在`config.toml`文件中的代理设置中正确配置。 26 * **更新`yt-dlp`:** 随软件捆绑的`yt-dlp`版本可能已过时。您可以通过在软件的`bin`目录中打开终端并运行以下命令手动更新: 27 ``` 28 ./yt-dlp.exe -U 29 ``` 30 31 (如果文件名与您的操作系统不同,请将`yt-dlp.exe`替换为正确的文件名)。 32 33 ### 3. 最终视频中的字幕乱码或显示为方块,特别是在Linux上。 34 35 这几乎总是由于系统缺少字体,特别是那些支持中文字符的字体。要解决此问题,您需要安装所需的字体。 36 37 1. 下载所需的字体,例如[Microsoft YaHei](https://modelscope.cn/models/Maranello/KrillinAI_dependency_cn/resolve/master/%E5%AD%97%E4%BD%93/msyh.ttc)和[Microsoft YaHei Bold](https://modelscope.cn/models/Maranello/KrillinAI_dependency_cn/resolve/master/%E5%AD%97%E4%BD%93/msyhbd.ttc)。 38 2. 创建一个新的字体目录:`sudo mkdir -p /usr/share/fonts/msyh`。 39 3. 将下载的`.ttc`字体文件复制到此新目录中。 40 4. 执行以下命令以重建字体缓存: 41 ``` 42 cd /usr/share/fonts/msyh 43 sudo mkfontscale 44 sudo mkfontdir 45 sudo fc-cache -fv 46 ``` 47 48 ### 4. 在macOS上,应用程序无法启动并显示“KrillinAI已损坏,无法打开”的错误。 49 50 这是由于macOS的安全功能Gatekeeper,限制了来自未识别开发者的应用程序。要解决此问题,您必须手动删除隔离属性。 51 52 1. 打开**终端**应用程序。 53 2. 输入命令`xattr -cr`后跟一个空格,然后将`KrillinAI.app`文件从Finder窗口拖到终端中。命令看起来像这样: 54 ``` 55 xattr -cr /Applications/KrillinAI.app 56 ``` 57 3. 按Enter键。您现在应该能够打开该应用程序。 58 59 ### 5. 在处理过程中,我收到类似`ffmpeg错误`、`audioToSrt错误`或`退出状态1`的错误。 60 61 这些错误通常指向依赖项或系统资源的问题。 62 63 * **`ffmpeg错误`:** 这表明`ffmpeg`未安装或无法从系统的PATH访问。确保您安装了完整的官方版本的`ffmpeg`,并且其位置已添加到系统的环境变量中。 64 * **`audioToSrt错误`或`退出状态1`:** 此错误发生在转录阶段(音频转文本)。常见原因包括: 65 * **模型问题:** 本地转录模型(例如`fasterwhisper`)未能加载或在下载过程中损坏。 66 * **内存不足(RAM):** 运行本地模型资源密集。如果您的机器内存不足,操作系统可能会终止该进程,从而导致错误。 67 * **网络故障:** 如果您使用在线转录服务(如OpenAI的Whisper API),这表明您的网络连接存在问题或API密钥无效。 68 69 ### 6. 进度条没有移动。程序是冻结了吗? 70 71 不是的,只要您没有看到错误消息,程序就正在工作。进度条仅在主要任务(如转录或视频编码)完全完成后更新。这些任务可能非常耗时,导致进度条长时间暂停。请耐心等待任务完成。 72 73 ### 7. 我的NVIDIA 5000系列GPU不支持`fasterwhisper`。我该怎么办? 74 75 观察到`fasterwhisper`模型可能无法与NVIDIA 5000系列GPU正常工作(截至2025年中期)。您有几个替代方案进行转录: 76 77 1. **使用基于云的模型:** 在`config.toml`文件中将`transcribe.provider.name`设置为`openai`或`aliyun`。然后,填写相应的API密钥和配置详细信息。这将使用云提供商的Whisper模型,而不是本地模型。 78 2. **使用其他本地模型:** 您可以尝试其他本地转录模型,例如原始的`whisper.cpp`。 79 80 ### 8. 如何找到并填写文本转语音的正确语音/音调代码? 81 82 可用的语音及其对应的代码由您使用的语音服务提供商定义。请参考他们的官方文档。 83 84 * **OpenAI TTS:** [文档](https://platform.openai.com/docs/guides/text-to-speech/api-reference)(查看`voice`选项)。 85 * **阿里云:** [文档](https://help.aliyun.com/zh/isi/developer-reference/overview-of-speech-synthesis)(查看音调列表中的`voice`参数)。 86 87 ### 9. 我如何使用本地大型语言模型(LLM),例如在Ollama上运行的模型进行翻译? 88 89 是的,您可以配置KrillinAI使用任何提供OpenAI兼容API端点的本地LLM。 90 91 1. **启动您的本地LLM:** 确保您的本地服务(例如,运行Llama3的Ollama)处于活动状态并可访问。 92 2. **编辑`config.toml`:** 在大型语言模型(翻译器)部分: 93 94 * 将提供者`name`(或`type`)设置为`"openai"`。 95 * 将`api_key`设置为任何随机字符串(例如,`"ollama"`),因为本地调用不需要它。 96 * 将`base_url`设置为您本地模型的API端点。对于Ollama,这通常是`http://localhost:11434/v1`。 97 * 将`model`设置为您提供的模型名称,例如`"llama3"`。 98 99 ### 10. 我可以自定义最终视频中的字幕样式(字体、大小、颜色)吗? 100 101 不可以。目前,KrillinAI生成**硬编码字幕**,这意味着它们直接嵌入到视频帧中。该应用程序**不提供自定义字幕样式的选项**;它使用预设样式。 102 103 对于高级自定义,推荐的解决方法是: 104 105 1. 使用KrillinAI生成翻译后的`.srt`字幕文件。 106 2. 将您的原始视频和此`.srt`文件导入专业视频编辑器(例如,Premiere Pro、Final Cut Pro、DaVinci Resolve),以在渲染之前应用自定义样式。 107 108 ### 11. 我已经有一个翻译后的`.srt`文件。KrillinAI可以仅使用它进行配音吗? 109 110 不可以,目前不支持此功能。该应用程序运行从转录到最终视频生成的完整流程。