快速筛选

回家地址： judh.pages.dev | rentry.org/judh | judh.top

AI其他

现代文转古文大模型

输入现代汉语句子，生成古汉语风格的句子

GPT Computer Agent

GPT Computer Agent

适用于 Windows、MacOS 和 Ubuntu 的 gpt-4o

EZ-Work文档翻译

人人可用的AI文档翻译助手

AI社交媒体管理工具，Buffer.com, Hypefury, Twitter Hunter开源替代

AI会议录音笔记摘要助手

开源唇型同步工具

Semantic Bookmark Manager

Semantic Bookmark Manager

基于 RAG 技术的语义搜索书签管理工具

Anthropic Quickstarts

Anthropic Quickstarts

帮助开发人员快速开始使用 Anthropic API 构建可部署应用程序的项目集合

Fullstack Cloudflare RAG

Fullstack Cloudflare RAG

基于Cloudflare构建全栈与PDF聊天的RAG应用

具有 GUI 界面的人脸交换项目

清华大学开源支持10000+ 字生成能力的模型

命令行语义图片搜索工具

自主编程代理

使用OpenAI 实时语音的开源框架

把任意url转成播客，然后推送到小宇宙平台。中文版NotebookLM 最好用的平替

AI将设计图转为HTML代码，用想象力来描述 UI 然后实时呈现，v0.dev的开源替代

支持在移动设备上本地运行小型语言模型的APP

NotebookLM Detector

NotebookLM Detector

ListenNotes 开源的检测播客内容是否是由NotebookLM 生成的工具

ComfyUI-AdvancedLivePortrait

ComfyUI-AdvancedLivePortrait

AI根据照片制作动画

利用 LLM 大模型辅助阅读 PDF 与观看视频，用以提升语言能力

面向复杂数学和算法任务的超级Prompt

一键生成TikTok、Instagram Reels、YouTube短视频

混合搜索引擎，结合了传统文本搜索和语义搜索的最佳特性

开源实时对话 AI 可穿戴设备，价格仅需几美元

基于浏览器的AI Web全栈开发工具，支持提示、编辑、部署的全栈流程

whisper-win-gui

whisper-win-gui

基于whisper的实时语音识别，提供网页版和桌面客户端

基于GPT4o的OCR工具

文本到音乐模型

可在资源受限的设备上运行的小型视觉语言模型

类 Apple Intelligence 的智能写作助手，提供了系统级别的语法检查、文本重写、翻译等功能

Local-File-Organizer

Local-File-Organizer

开源AI文件组织管理工具，类似 https://github.com/iyaja/llama-fs

浏览器端运行Real-ESRGAN 模型，将图片放大到超清分辨率

伯克利大学开源的支持使用 LLM 处理复杂的非结构化文档的工具

LangChain 开源的类似OpenAI的Canvas的工具，用于与Agent协作以更好地写作和编程任务

AI Youtube Shorts Generator

AI Youtube Shorts Generator

使用GPT-4 、Whisper ，提取长视频精华，一键生成切片短视频

AI Podcast Generator

AI Podcast Generator

自动AI播客生成工具，自动抓取互联网新闻内容生成音频播客

搜索真实文献并生成引用对应文献的AI论文

PDF to Audio Converter

PDF to Audio Converter

AI将 PDF 转换为音频播客、讲座、摘要等

开源，专为LLM设计的网页爬虫和抓取工具

开源 AI 视频、GIF 和图像超分辨率工具

上海交通大学的语音生成模型

Open NotebookLM

Open NotebookLM

开源版本的 Google NotebookLM ，将PDF转为音频文件（播客），基于开源模型实现

pdf-extract-api

pdf-extract-api

文档解析和提取 API，支持将 PDF 或图片文件转换为结构化的 JSON 或 Markdown 格式

Ultralight-Digital-Human

Ultralight-Digital-Human

超轻量级、可以在移动端实时运行的数字人模型

开源视频同步翻译工具，可以将视频和音频翻译成几十种语言，并提供 TTS 功能

提供转录、翻译和 TTS 的最佳gradio Web-ui，使用Faster whisper自动创建字幕

开源无代码ETL工具

具备视觉、语音和双工能力的开源GPT-4o

screenshot-to-code

screenshot-to-code

AI将屏幕截图、模型和 Figma 设计转换为代码

Claude 3.5 Sonnet computer use 的开源平替

将YouTube、PDF、论文、网站、纯文本等多源文本转换成多语言Podcast的开源工具

Microsoft Edge 在线文本转语音服务Python接口封装，无需 Microsoft Edge 或 Windows 或 API 密钥

Speech-AI-Forge

Speech-AI-Forge

开源文字转语音服务，内置多个音色可供选择，并可自行上传音色与参考音频

PDF 生成中文播客

带单词时间戳的高速语音识别项目，基于 SenseVoice

语音识别模型，在长语音识别上，超过了Whisper large-v3、NVIDIA Canary-1B

Automated-AI-Web-Researcher-Ollama

Automated-AI-Web-Researcher-Ollama

基于Ollama的AI自动化研究助手

自动生成钢琴伴奏模型，将任意音乐转换成与原曲匹配的钢琴伴奏

openai-captcha-detection

openai-captcha-detection

使用 ChatGPT 进行验证码识别的开源工具

智能语音转字幕文本工具，无需 GPU 和繁琐的本地配置