Cradicle Explorer

/ docs / zh / faq.md
faq.md
  1  ### 1. 程序报告“找不到配置文件”或“xxxxx需要配置xxxxx API密钥。”我该如何解决？
  2  
  3  这是一个常见的设置问题。可能发生这种情况的原因有几个：
  4  
  5  1. **文件位置或名称不正确：**
  6  
  7  * 程序需要一个名为`config.toml`的配置文件。确保您没有意外地将其命名为`config.toml.txt`。
  8  * 此文件必须放置在`config`文件夹内。工作目录的正确结构应为：
  9    ```
 10    /── config/
 11    │   └── config.toml
 12    └── krillinai.exe（您的可执行文件）
 13    ```
 14  * **对于Windows用户：** 建议将整个软件目录放在不在C:驱动器上的文件夹中，以避免潜在的权限问题。
 15  
 16  2. **API密钥配置不完整：**
 17  
 18  * 应用程序需要为大型语言模型（用于翻译）、语音服务（用于转录和语音合成）和tts服务分别配置。
 19  * 即使您使用OpenAI进行所有操作，您也必须在`config.toml`文件的不同部分填写密钥。查找`llm`部分、`transcribe`部分、`tts`部分，并填写相应的API密钥和其他所需信息。
 20  
 21  ### 2. 我收到包含“yt-dlp错误”的错误。该怎么办？
 22  
 23  此错误指向视频下载器的问题，通常与您的网络或下载器的版本有关。
 24  
 25  * **网络：** 如果您使用代理，请确保在`config.toml`文件中的代理设置中正确配置。
 26  * **更新`yt-dlp`：** 随软件捆绑的`yt-dlp`版本可能已过时。您可以通过在软件的`bin`目录中打开终端并运行以下命令手动更新：
 27    ```
 28    ./yt-dlp.exe -U
 29    ```
 30    
 31    （如果文件名与您的操作系统不同，请将`yt-dlp.exe`替换为正确的文件名）。
 32  
 33  ### 3. 最终视频中的字幕乱码或显示为方块，特别是在Linux上。
 34  
 35  这几乎总是由于系统缺少字体，特别是那些支持中文字符的字体。要解决此问题，您需要安装所需的字体。
 36  
 37  1. 下载所需的字体，例如[Microsoft YaHei](https://modelscope.cn/models/Maranello/KrillinAI_dependency_cn/resolve/master/%E5%AD%97%E4%BD%93/msyh.ttc)和[Microsoft YaHei Bold](https://modelscope.cn/models/Maranello/KrillinAI_dependency_cn/resolve/master/%E5%AD%97%E4%BD%93/msyhbd.ttc)。
 38  2. 创建一个新的字体目录：`sudo mkdir -p /usr/share/fonts/msyh`。
 39  3. 将下载的`.ttc`字体文件复制到此新目录中。
 40  4. 执行以下命令以重建字体缓存：
 41      ```
 42      cd /usr/share/fonts/msyh
 43      sudo mkfontscale
 44      sudo mkfontdir
 45      sudo fc-cache -fv
 46      ```
 47  
 48  ### 4. 在macOS上，应用程序无法启动并显示“KrillinAI已损坏，无法打开”的错误。
 49  
 50  这是由于macOS的安全功能Gatekeeper，限制了来自未识别开发者的应用程序。要解决此问题，您必须手动删除隔离属性。
 51  
 52  1. 打开**终端**应用程序。
 53  2. 输入命令`xattr -cr`后跟一个空格，然后将`KrillinAI.app`文件从Finder窗口拖到终端中。命令看起来像这样：
 54      ```
 55      xattr -cr /Applications/KrillinAI.app
 56      ```
 57  3. 按Enter键。您现在应该能够打开该应用程序。
 58  
 59  ### 5. 在处理过程中，我收到类似`ffmpeg错误`、`audioToSrt错误`或`退出状态1`的错误。
 60  
 61  这些错误通常指向依赖项或系统资源的问题。
 62  
 63  * **`ffmpeg错误`：** 这表明`ffmpeg`未安装或无法从系统的PATH访问。确保您安装了完整的官方版本的`ffmpeg`，并且其位置已添加到系统的环境变量中。
 64  * **`audioToSrt错误`或`退出状态1`：** 此错误发生在转录阶段（音频转文本）。常见原因包括：
 65    * **模型问题：** 本地转录模型（例如`fasterwhisper`）未能加载或在下载过程中损坏。
 66    * **内存不足（RAM）：** 运行本地模型资源密集。如果您的机器内存不足，操作系统可能会终止该进程，从而导致错误。
 67    * **网络故障：** 如果您使用在线转录服务（如OpenAI的Whisper API），这表明您的网络连接存在问题或API密钥无效。
 68  
 69  ### 6. 进度条没有移动。程序是冻结了吗？
 70  
 71  不是的，只要您没有看到错误消息，程序就正在工作。进度条仅在主要任务（如转录或视频编码）完全完成后更新。这些任务可能非常耗时，导致进度条长时间暂停。请耐心等待任务完成。
 72  
 73  ### 7. 我的NVIDIA 5000系列GPU不支持`fasterwhisper`。我该怎么办？
 74  
 75  观察到`fasterwhisper`模型可能无法与NVIDIA 5000系列GPU正常工作（截至2025年中期）。您有几个替代方案进行转录：
 76  
 77  1. **使用基于云的模型：** 在`config.toml`文件中将`transcribe.provider.name`设置为`openai`或`aliyun`。然后，填写相应的API密钥和配置详细信息。这将使用云提供商的Whisper模型，而不是本地模型。
 78  2. **使用其他本地模型：** 您可以尝试其他本地转录模型，例如原始的`whisper.cpp`。
 79  
 80  ### 8. 如何找到并填写文本转语音的正确语音/音调代码？
 81  
 82  可用的语音及其对应的代码由您使用的语音服务提供商定义。请参考他们的官方文档。
 83  
 84  * **OpenAI TTS：** [文档](https://platform.openai.com/docs/guides/text-to-speech/api-reference)（查看`voice`选项）。
 85  * **阿里云：** [文档](https://help.aliyun.com/zh/isi/developer-reference/overview-of-speech-synthesis)（查看音调列表中的`voice`参数）。
 86  
 87  ### 9. 我如何使用本地大型语言模型（LLM），例如在Ollama上运行的模型进行翻译？
 88  
 89  是的，您可以配置KrillinAI使用任何提供OpenAI兼容API端点的本地LLM。
 90  
 91  1. **启动您的本地LLM：** 确保您的本地服务（例如，运行Llama3的Ollama）处于活动状态并可访问。
 92  2. **编辑`config.toml`：** 在大型语言模型（翻译器）部分：
 93  
 94  * 将提供者`name`（或`type`）设置为`"openai"`。
 95  * 将`api_key`设置为任何随机字符串（例如，`"ollama"`），因为本地调用不需要它。
 96  * 将`base_url`设置为您本地模型的API端点。对于Ollama，这通常是`http://localhost:11434/v1`。
 97  * 将`model`设置为您提供的模型名称，例如`"llama3"`。
 98  
 99  ### 10. 我可以自定义最终视频中的字幕样式（字体、大小、颜色）吗？
100  
101  不可以。目前，KrillinAI生成**硬编码字幕**，这意味着它们直接嵌入到视频帧中。该应用程序**不提供自定义字幕样式的选项**；它使用预设样式。
102  
103  对于高级自定义，推荐的解决方法是：
104  
105  1. 使用KrillinAI生成翻译后的`.srt`字幕文件。
106  2. 将您的原始视频和此`.srt`文件导入专业视频编辑器（例如，Premiere Pro、Final Cut Pro、DaVinci Resolve），以在渲染之前应用自定义样式。
107  
108  ### 11. 我已经有一个翻译后的`.srt`文件。KrillinAI可以仅使用它进行配音吗？
109  
110  不可以，目前不支持此功能。该应用程序运行从转录到最终视频生成的完整流程。