归档: 2024

stable diffusion 原理

stable diffusion 原理Stable Diffusion 的数据会在像素空间(Pixel Space)、潜在空间(Latent Space)、条件(Conditioning)三部分之间流转,其算法逻辑大概分这几步 图像编码器将图像从像素空间(Pixel Space)压缩到更小维度的潜在空间(Latent Space),捕捉图像更本质的信息; 对潜在空间中的图片添加噪声,进行扩散过

Contrastive Language-Image Pre-training(CLIP)

Contrastive Language-Image Pre-training(CLIP)https://blog.csdn.net/weixin_53297048/article/details/130719092 一种基于对比文本-图像对的预训练方法或者模型。 CLIP包括两个模型:Text Encoder和Image Encoder,其中Text Encoder用来提取文本的特征,可以采用

潜在扩散模型(LDM / Latent Diffusion Model)

潜在扩散模型(LDM / Latent Diffusion Model)https://zhuanlan.zhihu.com/p/595909681?utm_id=0 在计算机眼中,一张 512x512 分辨率的图片,就是一组 512 * 512 * 3 的数字,如果直接对图片进行学习,相当于 AI 要处理 786432 维的数据,这对算力、计算机性能要求很高。 可以将图片映射到潜在空

AudioLDM2 音频生成

AudioLDM2 音频生成安装12345678910conda create -n audiocraft python=3.9 -yconda activate audiocraftpip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118python>>&g

Mermaid 绘制流程图

Mermaid 绘制流程图.mmd 文件 Mermaid 是一个用于画流程图、状态图、时序图、甘特图的库,使用 JS 进行本地渲染,广泛集成于许多 Markdown 编辑器中。 官网:https://mermaidjs.github.io/ Github 项目地址:https://github.com/knsv/mermaid Mermaid 支持多种图表的方向,语法如下: 12graph 方

Jupyter Notebook

Jupyter Notebookhttps://zhuanlan.zhihu.com/p/33105153 Jupyter Notebook是以网页的形式打开,可以在网页页面中直接编写代码和运行代码,代码的运行结果也会直接在代码块下显示的程序。如在编程过程中需要编写说明文档,可在同一个页面中直接编写,便于作及时的说明和解释。 这些文档是保存为后缀名为.ipynb的JSON格式文件,不仅便于版本控

Nodejs 生成18位唯一数字

Nodejs 生成18位唯一数字使用 nanoid,老版本 3.0.2 是可以使用require的,目前的==最新版nanoid只支持import,不支持require== npm install -S nanoid@3.0.2 123const { customAlphabet } = require('nanoid

Meta audiocraft 超强文本转音乐

Meta audiocraft 超强文本转音乐https://dyss.top/1087 安装1234567891011conda create -n audiocraft python=3.9 -yconda activate audiocraftpip install torch torchvision torchaudio --index-url https://download.pyto

stable diffusion webui 安装 gfpgan 失败的解决方案

stable diffusion webui 安装 gfpgan 失败的解决方案https://blog.csdn.net/weixin_40735291/article/details/129153398 直接到github下载 GFPGAN 代码到本地,并进行本地安装 https://gitcode.net/mirrors/TencentARC/GFPGAN?utm_source=csd

VSCode 调试开发 Unity

VSCode 调试开发 Unity VSCode 插件安装 .NET Install Tool for Extension Authors 版本:v1.6.0 厂商:Microsoft C# ==版本:v1.24.1== 最新版本2.0的不行,导致没有提示 厂商:Microsoft C# Dev Kit 版本:v0.3.21 厂商:Micro

AI 机器学习的专业算法研究网站

AI 机器学习的专业算法研究网站==https://paperswithcode.com/sota== 查找论文对应开源代码的神器(Papers with Code) paperswithcode 是一站式的门户网站,可访问包括机器学习模型、数据集、方法、评估表和代码在内的开源资源,了解当下最先进的研究论文,幸运的话会有相应的数据集和代码。 可以通过使用平台上面的代码重现论文

如何用AI提升自己的业务能力

如何用AI提升自己的业务能力https://www.sohu.com/a/707835568_99922069 用AI解决问题的能力落实到场景中,就是用AI提升业务能力。用AI提升业务能力包括三个关键要素:第一,要提升核心竞争力。 第二,要用AIGC来助力。 第三,要提升业务实战能力。 提升核心竞争力 职场核心竞争力包括哪些? 第一个核心能力是市场分析力。要知道市场的外部发生了哪些变化,掌握

10款最佳人工智能游戏生成器

10款最佳人工智能游戏生成器https://mp.weixin.qq.com/s/9XIzXob6kuQIR7CqpmP-Zw Scenario https://www.scenario.com/ Scenario 是一款由人工智能驱动的工具,为游戏艺术创作提供了一套全面的功能。它旨在帮助游戏开发者创建符合其风格和艺术方向的独特、高质量的游戏艺术。Scenario 的突出特点之一是它的微调能

Ludo.ai

Ludo.aihttp://ludo.ai/ ludo.ai 人机协作加速游戏创意,游戏概念的生产车间。 主要目的是帮助我们完成一份游戏设计文档。用户可以根据关键词、游戏名称、相似游戏等方式查找灵感。 最大的方便是提供了一个模板,在模板上提供了输入控件,从而联动AI功能。 技术上,是基于100万款游戏的数据集,使用机器学习和自然语言处理进行处理。

修改 npm 源

修改 npm 源最近 npm install 总是失败卡住,需要换 npm 源 临时使用 在 npm install XXX 时加入–registry URL即可,不会影响到本地配置,如: 1npm --registry https://registry.npmmirror.com install express 持久使用 永久修改本地npm的配置: 1npm config set r

模型技术 - GGML

模型技术 - GGMLGGML 是一个纯C语言编写的张量库,可帮助开发者在消费级硬件上运行大模型。由于加速效果惊人,一下子收获了不少开发者的支持。 https://ggerganov.com/ http://ggml.ai/

模型量化技术 - GPTQ

模型量化技术 - GPTQ原文链接:https://blog.csdn.net/chattyfish/article/details/131874310 GPTQ是一种一次性权重量化方法,专为生成预训练Transformer(GPT)模型设计。该方法基于近似二阶信息,旨在实现高度准确和高效。 关于GPTQ的关键点: GPTQ可以在大约四个GPU小时内量化具有1750亿参数的GPT模型,将位宽减

AI 将创造哪些新的游戏玩法

AI 将创造哪些新的游戏玩法https://web.panewslab.com/zh/articledetails/78fxz9sj.html 包括生成式智能体、个性化、AI叙事、动态世界和AI副驾驶。 生成式智能体模拟游戏《模拟人生》,玩家在游戏中管理被称为 “模拟人 “的虚拟人,让他们过着自己的日常生活。 生成式AI可以通过大型语言模型(LLM)驱动的新兴社会行为,使得智能体更加逼真,从而大

Unity 第三方 AI 市场

Unity 第三方 AI 市场AtlasAtlas是利用生成式3D AI技术快速创作资产和虚拟世界的一系列工具,旨在打造多元化的3D物体。目前推出的第一个工具是语言图片神经网络,可以基于文字指令检索许可授权模型,你只需要简单描述你需要的资产,它就可以帮你导入到场景中。 通过AI技术,开发者还可以用Atlas快速创作游戏内地形。 ConvaiConvai是一款智能NPC工具,它可以用生成式AI技术

Inworld.ai

Inworld.aiInworld.ai是一个为虚拟游戏角色赋予智能和个性的AI应用开发平台,它可以让开发者通过自然语言描述和简单的控制,快速创建具有不同性格、情感、记忆和知识的AI角色,并将它们集成到各种实时应用中,如游戏、VR/AR、虚拟世界和元宇宙等。 Inworld.ai的目标是让AI角色能够与用户进行更自然、更有趣和更有意义的交互,提高用户的沉浸感和连接感。 角色引擎 Inw

版号国家新闻出版署查询

版号国家新闻出版署查询(一)官方网站查询路径: 1.游戏出版后,可通过国家新闻出版署的官方网站查询审批信息(具体位置:首页 > 办事服务 > 结果公示 > 游戏审批结果); https://www.nppa.gov.cn/bsfw/jggs/ 2.也可以通过游戏工委主办的“游戏产业网”的“版号查询”栏目查询审批信息; (二)官方出具的3类请示及批复文件,包含: 1.出版服务单位

huggingface 上模型下载和通用运行方法

huggingface 上模型下载和通用运行方法下载模型1git clone -b int4 https://huggingface.co/THUDM/chatglm-6b.git 命令行 python 运行模型12345678910pythonmypath="F:\GIT_AI/chatglm-6b" # 导入依赖 from transformers import Au

LLM 模型的下载目录

LLM 模型的下载目录windows 下各个模型从 huggingface 下载后都在以下目录中: C:\Users\Administrator.cache\huggingface\hub

Vicuna 模型的安装

Vicuna 模型的安装Vicuna-13B是在LLaMa-13B的基础上使用监督数据微调得到的模型,数据集来自于ShareGPT.com产生的用户对话数据,共70K条。ShareGPT是一个ChatGPT数据共享网站,用户会上传自己觉得有趣的ChatGPT 回答。 使用 GPT-4 作为判断的初步评估表明,Vicuna-13B 达到了 OpenAI ChatGPT 和 Google Bard

OpenCompass LLM 评测简介

OpenCompass LLM 评测简介OpenCompass 是一款开源、高效、全面的评测大模型体系及开放平台。提供完整开源可复现的评测框架,支持大语言模型、多模态模型各类模型的一站式评测。 模型 发布日期 参数量 综合评分(均分) 综合评分(英文) 学科综合能力 语言能力 知识能力 理解能力 推理能力 ChatGPT 2023/3/1 N/A 62

BLOOM 简介

BLOOM 简介BLOOM 系列模型是由BigScience团队训练的大语言模型。训练数据包含了英语、中文、法语、西班牙语、葡萄牙语等共46种语言,另外还包含13种编程语言。 模型结构上,与GPT相同,BLOOM采用了causal decoder-only的transformer模型结构。 基于BLOOM衍生出来的大模型应用: 轩辕: 金融领域大模型,度小满在BLOOM-176B的基础上针对中

ChatGLM-6B 简介

ChatGLM-6B 简介ChatGLM-6B是清华大学提出的支持中英双语问答的对话语言模型。ChatGLM-6B采用了与GLM-130B相同的模型结构。 模型结构上,ChatGLM-6B采用了prefix decoder-only的transformer模型框架,在输入上采用双向的注意力机制,在输出上采用单向注意力机制。 基于ChatGLM衍生出来的大模型应用: langchain-Chat