输入现代汉语句子,生成古汉语风格的句子
适用于 Windows、MacOS 和 Ubuntu 的 gpt-4o
人人可用的AI文档翻译助手
AI社交媒体管理工具,Buffer.com, Hypefury, Twitter Hunter开源替代
AI会议录音笔记摘要助手
开源唇型同步工具
基于 RAG 技术的语义搜索书签管理工具
帮助开发人员快速开始使用 Anthropic API 构建可部署应用程序的项目集合
基于Cloudflare构建全栈与PDF聊天的RAG应用
具有 GUI 界面的人脸交换项目
清华大学开源支持10000+ 字生成能力的模型
命令行语义图片搜索工具
自主编程代理
使用OpenAI 实时语音的开源框架
把任意url转成播客,然后推送到小宇宙平台。中文版NotebookLM 最好用的平替
AI将设计图转为HTML代码,用想象力来描述 UI 然后实时呈现,v0.dev的开源替代
支持在移动设备上本地运行小型语言模型的APP
ListenNotes 开源的检测播客内容是否是由NotebookLM 生成的工具
AI根据照片制作动画
利用 LLM 大模型辅助阅读 PDF 与观看视频,用以提升语言能力
面向复杂数学和算法任务的超级Prompt
一键生成TikTok、Instagram Reels、YouTube短视频
混合搜索引擎,结合了传统文本搜索和语义搜索的最佳特性
开源实时对话 AI 可穿戴设备,价格仅需几美元
基于浏览器的AI Web全栈开发工具,支持提示、编辑、部署的全栈流程
基于whisper的实时语音识别,提供网页版和桌面客户端
基于GPT4o的OCR工具
文本到音乐模型
可在资源受限的设备上运行的小型视觉语言模型
类 Apple Intelligence 的智能写作助手,提供了系统级别的语法检查、文本重写、翻译等功能
开源AI文件组织管理工具,类似 https://github.com/iyaja/llama-fs
浏览器端运行Real-ESRGAN 模型,将图片放大到超清分辨率
伯克利大学开源的支持使用 LLM 处理复杂的非结构化文档的工具
LangChain 开源的类似OpenAI的Canvas的工具,用于与Agent协作以更好地写作和编程任务
使用GPT-4 、Whisper ,提取长视频精华,一键生成切片短视频
自动AI播客生成工具,自动抓取互联网新闻内容生成音频播客
搜索真实文献并生成引用对应文献的AI论文
AI将 PDF 转换为音频播客、讲座、摘要等
开源,专为LLM设计的网页爬虫和抓取工具
开源 AI 视频、GIF 和图像超分辨率工具
上海交通大学的语音生成模型
开源版本的 Google NotebookLM ,将PDF转为音频文件(播客),基于开源模型实现
文档解析和提取 API,支持将 PDF 或图片文件转换为结构化的 JSON 或 Markdown 格式
超轻量级、可以在移动端实时运行的数字人模型
开源视频同步翻译工具,可以将视频和音频翻译成几十种语言,并提供 TTS 功能
提供转录、翻译和 TTS 的最佳gradio Web-ui,使用Faster whisper自动创建字幕
开源无代码ETL工具
具备视觉、语音和双工能力的开源GPT-4o
AI将屏幕截图、模型和 Figma 设计转换为代码
Claude 3.5 Sonnet computer use 的开源平替
将YouTube、PDF、论文、网站、纯文本等多源文本转换成多语言Podcast的开源工具
Microsoft Edge 在线文本转语音服务Python接口封装,无需 Microsoft Edge 或 Windows 或 API 密钥
开源文字转语音服务,内置多个音色可供选择,并可自行上传音色与参考音频
PDF 生成中文播客
带单词时间戳的高速语音识别项目,基于 SenseVoice
语音识别模型,在长语音识别上,超过了Whisper large-v3、NVIDIA Canary-1B
基于Ollama的AI自动化研究助手
自动生成钢琴伴奏模型,将任意音乐转换成与原曲匹配的钢琴伴奏
使用 ChatGPT 进行验证码识别的开源工具
智能语音转字幕文本工具,无需 GPU 和繁琐的本地配置