AI交流(进群备注:CTRL-F-VIDEO)

CTRL-F-VIDEO 是一个开源项目,旨在帮助用户在视频中搜索特定的单词或短语。它主要针对YouTube视频,通过Chrome扩展实现搜索功能。项目利用OpenAI的Whisper模型将视频中的音频转换为文本,从而实现准确的搜索和匹配。搜索结果会被存储在json文件中,便于之后再次访问该视频时快速获取之前的搜索结果。项目还支持时间轴高亮显示,帮助用户快速定位关键词在视频中的位置。
CTRL-F-VIDEO的特点:
- 1. 利用OpenAI的Whisper模型进行音频转文本
- 2. 支持YouTube视频的关键词搜索
- 3. 搜索结果存储在json文件中,便于后续快速访问
- 4. 支持时间轴高亮显示关键词位置
- 5. 提供语音相似性搜索选项(尽管由于Whisper的高效性,此功能较少使用)
CTRL-F-VIDEO的功能:
- 1. 将项目文件夹导入Chrome扩展,使用‘加载已解压的扩展程序’功能
- 2. 在python文件夹中运行‘python app.py’,启动本地Flask API
- 3. 访问YouTube视频,点击扩展图标,输入关键词或短语,点击‘Mark Video’进行搜索
- 4. 使用‘Show similar’查看语音相似性匹配结果
- 5. 使用‘Show all’查看所有匹配结果
- 6. 使用‘Remove stamps’清除时间轴上的标记
相关导航
暂无评论...