/ docs / zh / faq.md
faq.md
  1  ### 1. 程序报告“找不到配置文件”或“xxxxx需要配置xxxxx API密钥。”我该如何解决?
  2  
  3  这是一个常见的设置问题。可能发生这种情况的原因有几个:
  4  
  5  1. **文件位置或名称不正确:**
  6  
  7  * 程序需要一个名为`config.toml`的配置文件。确保您没有意外地将其命名为`config.toml.txt`。
  8  * 此文件必须放置在`config`文件夹内。工作目录的正确结构应为:
  9    ```
 10    /── config/
 11    │   └── config.toml
 12    └── krillinai.exe(您的可执行文件)
 13    ```
 14  * **对于Windows用户:** 建议将整个软件目录放在不在C:驱动器上的文件夹中,以避免潜在的权限问题。
 15  
 16  2. **API密钥配置不完整:**
 17  
 18  * 应用程序需要为大型语言模型(用于翻译)、语音服务(用于转录和语音合成)和tts服务分别配置。
 19  * 即使您使用OpenAI进行所有操作,您也必须在`config.toml`文件的不同部分填写密钥。查找`llm`部分、`transcribe`部分、`tts`部分,并填写相应的API密钥和其他所需信息。
 20  
 21  ### 2. 我收到包含“yt-dlp错误”的错误。该怎么办?
 22  
 23  此错误指向视频下载器的问题,通常与您的网络或下载器的版本有关。
 24  
 25  * **网络:** 如果您使用代理,请确保在`config.toml`文件中的代理设置中正确配置。
 26  * **更新`yt-dlp`:** 随软件捆绑的`yt-dlp`版本可能已过时。您可以通过在软件的`bin`目录中打开终端并运行以下命令手动更新:
 27    ```
 28    ./yt-dlp.exe -U
 29    ```
 30    
 31    (如果文件名与您的操作系统不同,请将`yt-dlp.exe`替换为正确的文件名)。
 32  
 33  ### 3. 最终视频中的字幕乱码或显示为方块,特别是在Linux上。
 34  
 35  这几乎总是由于系统缺少字体,特别是那些支持中文字符的字体。要解决此问题,您需要安装所需的字体。
 36  
 37  1. 下载所需的字体,例如[Microsoft YaHei](https://modelscope.cn/models/Maranello/KrillinAI_dependency_cn/resolve/master/%E5%AD%97%E4%BD%93/msyh.ttc)和[Microsoft YaHei Bold](https://modelscope.cn/models/Maranello/KrillinAI_dependency_cn/resolve/master/%E5%AD%97%E4%BD%93/msyhbd.ttc)。
 38  2. 创建一个新的字体目录:`sudo mkdir -p /usr/share/fonts/msyh`。
 39  3. 将下载的`.ttc`字体文件复制到此新目录中。
 40  4. 执行以下命令以重建字体缓存:
 41      ```
 42      cd /usr/share/fonts/msyh
 43      sudo mkfontscale
 44      sudo mkfontdir
 45      sudo fc-cache -fv
 46      ```
 47  
 48  ### 4. 在macOS上,应用程序无法启动并显示“KrillinAI已损坏,无法打开”的错误。
 49  
 50  这是由于macOS的安全功能Gatekeeper,限制了来自未识别开发者的应用程序。要解决此问题,您必须手动删除隔离属性。
 51  
 52  1. 打开**终端**应用程序。
 53  2. 输入命令`xattr -cr`后跟一个空格,然后将`KrillinAI.app`文件从Finder窗口拖到终端中。命令看起来像这样:
 54      ```
 55      xattr -cr /Applications/KrillinAI.app
 56      ```
 57  3. 按Enter键。您现在应该能够打开该应用程序。
 58  
 59  ### 5. 在处理过程中,我收到类似`ffmpeg错误`、`audioToSrt错误`或`退出状态1`的错误。
 60  
 61  这些错误通常指向依赖项或系统资源的问题。
 62  
 63  * **`ffmpeg错误`:** 这表明`ffmpeg`未安装或无法从系统的PATH访问。确保您安装了完整的官方版本的`ffmpeg`,并且其位置已添加到系统的环境变量中。
 64  * **`audioToSrt错误`或`退出状态1`:** 此错误发生在转录阶段(音频转文本)。常见原因包括:
 65    * **模型问题:** 本地转录模型(例如`fasterwhisper`)未能加载或在下载过程中损坏。
 66    * **内存不足(RAM):** 运行本地模型资源密集。如果您的机器内存不足,操作系统可能会终止该进程,从而导致错误。
 67    * **网络故障:** 如果您使用在线转录服务(如OpenAI的Whisper API),这表明您的网络连接存在问题或API密钥无效。
 68  
 69  ### 6. 进度条没有移动。程序是冻结了吗?
 70  
 71  不是的,只要您没有看到错误消息,程序就正在工作。进度条仅在主要任务(如转录或视频编码)完全完成后更新。这些任务可能非常耗时,导致进度条长时间暂停。请耐心等待任务完成。
 72  
 73  ### 7. 我的NVIDIA 5000系列GPU不支持`fasterwhisper`。我该怎么办?
 74  
 75  观察到`fasterwhisper`模型可能无法与NVIDIA 5000系列GPU正常工作(截至2025年中期)。您有几个替代方案进行转录:
 76  
 77  1. **使用基于云的模型:** 在`config.toml`文件中将`transcribe.provider.name`设置为`openai`或`aliyun`。然后,填写相应的API密钥和配置详细信息。这将使用云提供商的Whisper模型,而不是本地模型。
 78  2. **使用其他本地模型:** 您可以尝试其他本地转录模型,例如原始的`whisper.cpp`。
 79  
 80  ### 8. 如何找到并填写文本转语音的正确语音/音调代码?
 81  
 82  可用的语音及其对应的代码由您使用的语音服务提供商定义。请参考他们的官方文档。
 83  
 84  * **OpenAI TTS:** [文档](https://platform.openai.com/docs/guides/text-to-speech/api-reference)(查看`voice`选项)。
 85  * **阿里云:** [文档](https://help.aliyun.com/zh/isi/developer-reference/overview-of-speech-synthesis)(查看音调列表中的`voice`参数)。
 86  
 87  ### 9. 我如何使用本地大型语言模型(LLM),例如在Ollama上运行的模型进行翻译?
 88  
 89  是的,您可以配置KrillinAI使用任何提供OpenAI兼容API端点的本地LLM。
 90  
 91  1. **启动您的本地LLM:** 确保您的本地服务(例如,运行Llama3的Ollama)处于活动状态并可访问。
 92  2. **编辑`config.toml`:** 在大型语言模型(翻译器)部分:
 93  
 94  * 将提供者`name`(或`type`)设置为`"openai"`。
 95  * 将`api_key`设置为任何随机字符串(例如,`"ollama"`),因为本地调用不需要它。
 96  * 将`base_url`设置为您本地模型的API端点。对于Ollama,这通常是`http://localhost:11434/v1`。
 97  * 将`model`设置为您提供的模型名称,例如`"llama3"`。
 98  
 99  ### 10. 我可以自定义最终视频中的字幕样式(字体、大小、颜色)吗?
100  
101  不可以。目前,KrillinAI生成**硬编码字幕**,这意味着它们直接嵌入到视频帧中。该应用程序**不提供自定义字幕样式的选项**;它使用预设样式。
102  
103  对于高级自定义,推荐的解决方法是:
104  
105  1. 使用KrillinAI生成翻译后的`.srt`字幕文件。
106  2. 将您的原始视频和此`.srt`文件导入专业视频编辑器(例如,Premiere Pro、Final Cut Pro、DaVinci Resolve),以在渲染之前应用自定义样式。
107  
108  ### 11. 我已经有一个翻译后的`.srt`文件。KrillinAI可以仅使用它进行配音吗?
109  
110  不可以,目前不支持此功能。该应用程序运行从转录到最终视频生成的完整流程。