使用LLM从非结构化数据构建 Neo4j 图
本地语音助手,基于Ollama, Hugging Face Transformers, Coqui TTS Toolkit
集成了20+ 高性能LLM,具有用于大规模预训练、微调和部署的能力
从单个图像生成高质量和高效的3D网格
24/7 全天候录制您的屏幕和麦克风并将其连接到 LLM,类似 Windows Recall,rewind.ai
复旦开源的根据音频和图片生成说话视频的项目
阿里巴巴开源的多语言大语音生成模型,提供推理、训练和部署全栈能力
产品化程度较高的开源 RAG 引擎
基于gpt-4o-mini 的OCR工具
面向 AI Agent 的工具集
AI辅助生成、修复和扩展Wordpress插件
基于PaddleOCR重构的轻量级OCR工具,推理速度是PaddlePaddle框架的5倍
李笑来老师团队开发的英语AI学习软件
开源AI搜索引擎
交互式学习文本生成模型的工具,可实时观察Transformer模型内部组件如何协同工作来预测下一个词
个性化 AI 的记忆层,爆火应用Dot背后核心的技术
开源AI故事可视化工具
来自CAMB.AI的开源TTS模型,只需 5 秒的音频和文本,就可以生成对应文本语音
构建Agent工作流的开源框架
AI吟美-人工智能主播-Vtuber
提示词创建和评估工具
使用视觉大语言模型(如 GPT-4o)将 PDF 解析为 markdown
智能视频多语言AI配音/翻译工具
基于Prompt的 Python Web 应用程序生成器
开源AI 生产力工具
音视频转结构化笔记系统,能够快速提取音视频内容,调用大模型整理成markdown文件
开源AI 数据源解析工具
AI 音乐播放器,AI 版网易云音乐
基于知识图谱的AI智能体,推动李白文化的数字化普及与推广,提供古诗词问答与鉴赏体验
在Azure上一键部署GraphRAG
心理大模型
自动视频生成器,给定主题,自动生成解说视频
只需一张照片,实现实时换脸和一键视频 deepfake
自动识别出相册中图像文件的元信息,然后借助RAG技术,实现了与相册对话的能力
基于Llama 3.1的AI个人辅导工具
基于GPT-4o 的漫画翻译器
在 cursor 中针对常见编程框架和语言优化的Prompt 配置规则
牛津大学开源的世界首个用于自动研究和开放式发现的 “AI 科学家”
虚拟试衣系统,可灵活控制模特面孔、姿势和场景
用AI来改变拖延症
一站式开源高质量数据提取工具,支持PDF/网页/多格式电子书提取
维基百科语义搜索和 RAG 提问
基于FastAPI构建的AI模型服务引擎,比普通的FastAPI快2倍
各大主流AI模型越狱方法
SQLite的向量搜索扩展
AI 智能生成 PPT
支付宝开源的基于音频驱动的肖像动画生成工具
一键把comfyui工作流转为“微信小程序”、“抖音小程序”、“微信内H5”、“微信外H5”,且都支持支付变现
将文本转化成知识图谱的工具
轻量级RSS中间件, 提取全文, 翻译、摘要一站式服务
多模态 LaTeX 公式识别工具
一站式 AI 影视解说+自动化剪辑工具
Netflix级字幕切割翻译、精确对齐和个性化配音,一键全自动视频搬运
轻量级LLM网页数据爬取工具
基于Dify的AI数字人
AI 相亲分析师+AI 打假媒婆
开源使用WebGPU在浏览器端去图片背景应用
HuggingFace 开源的低成本 AI 机器人
基于RAG的开源工具,用于与文档聊天
轻量级的AI证件照制作算法