达摩 text-to-video-ms-1.7b 文本生成视频
达摩 text-to-video-ms-1.7b 文本生成视频安装1234567891011conda create -n videoai python=3.9 -yconda activate videoaipip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118pyth
达摩 text-to-video-ms-1.7b 文本生成视频安装1234567891011conda create -n videoai python=3.9 -yconda activate videoaipip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118pyth
stable diffusion 原理Stable Diffusion 的数据会在像素空间(Pixel Space)、潜在空间(Latent Space)、条件(Conditioning)三部分之间流转,其算法逻辑大概分这几步: 图像编码器将图像从像素空间(Pixel Space)压缩到更小维度的潜在空间(Latent Space),捕捉图像更本质的信息 对潜在空间中的图片添加噪声,进行扩散过
Contrastive Language-Image Pre-training(CLIP)学习资源 CSDN文章 简介一种基于对比文本-图像对的预训练方法或者模型。 CLIP包括两个模型: Text Encoder:用来提取文本的特征,可以采用NLP中常用的text transformer模型 Image Encoder:用来提取图像的特征,可以采用常用CNN模型或者vision transf
潜在扩散模型(LDM / Latent Diffusion Model)学习资源 知乎文章 简介在计算机眼中,一张 512x512 分辨率的图片,就是一组 512 * 512 * 3 的数字,如果直接对图片进行学习,相当于 AI 要处理 786432 维的数据,这对算力、计算机性能要求很高。 可以将图片映射到潜在空间(Latent Space)后进行扩散和逆扩散学习。如何理解 “潜在空
AudioLDM2 音频生成安装123456789conda create -n audiocraft python=3.9 -yconda activate audiocraftpip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118python>>>
Mermaid 绘制流程图.mmd 文件Mermaid 是一个用于画流程图、状态图、时序图、甘特图的库,使用 JS 进行本地渲染,广泛集成于许多 Markdown 编辑器中。 项目资源 官网地址 GitHub项目地址 语法说明Mermaid 支持多种图表的方向,语法如下: 12graph 方向描述 图表中的其他语句... 示例1234567graph TB id1(圆角矩形)--普
Jupyter Notebook学习资源 知乎文章 简介Jupyter Notebook是以网页的形式打开,可以在网页页面中直接编写代码和运行代码,代码的运行结果也会直接在代码块下显示的程序。如在编程过程中需要编写说明文档,可在同一个页面中直接编写,便于作及时的说明和解释。 这些文档是保存为后缀名为.ipynb的JSON格式文件,不仅便于版本控制,也方便与他人共享。 此外,文档还可以导出为:HT
Nodejs 生成18位唯一数字使用 nanoid,老版本 3.0.2 是可以使用require的,目前的最新版nanoid只支持import,不支持require 1npm install -S nanoid@3.0.2 123const { customAlphabet } = require('nanoid')const nanoid = custo
Meta audiocraft 超强文本转音乐学习资源 参考文章 安装步骤123456789conda create -n audiocraft python=3.9 -yconda activate audiocraftpip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu
stable diffusion webui 安装 gfpgan 失败的解决方案学习资源 CSDN解决方案 解决方案步骤 直接到github下载 GFPGAN 代码到本地,并进行本地安装 GitHub镜像地址 下载后,解压(如果用git clone就不需要)到 d:\stable-diffusion-webui\venv\Scripts 目录下 打开cmd,cd 到 d:\stable-
VSCode 调试开发 Unity1. VSCode 插件安装 .NET Install Tool for Extension Authors 版本:v1.6.0 厂商:Microsoft C# 版本:v1.24.1 (最新版本2.0的不行,导致没有提示) 厂商:Microsoft C# Dev Kit 版本:v0.3.21 厂商:Microsoft Unity 版本:v0.9
AI 机器学习的专业算法研究网站 Papers with Code 查找论文对应开源代码的神器(Papers with Code) paperswithcode 是一站式的门户网站,可访问包括机器学习模型、数据集、方法、评估表和代码在内的开源资源,了解当下最先进的研究论文,幸运的话会有相应的数据集和代码。 可以通过使用平台上面的代码重现论文的结果,使用模型性能指标检查所有先前的实现,查看研究论文
如何用AI提升自己的业务能力学习资源 参考文章 用AI提升业务能力的三个关键要素用AI解决问题的能力落实到场景中,就是用AI提升业务能力。用AI提升业务能力包括三个关键要素: 第一,要提升核心竞争力职场核心竞争力包括哪些? 市场分析力:要知道市场的外部发生了哪些变化,掌握它的动态,很多做销售的人都缺乏市场分析力,或者有想法难以实践。 用户洞察力:现在的产品,同质化越来越高,实现高转化率和复购
10款最佳人工智能游戏生成器学习资源 参考文章 1. Scenario 官网地址 Scenario 是一款由人工智能驱动的工具,为游戏艺术创作提供了一套全面的功能。它旨在帮助游戏开发者创建符合其风格和艺术方向的独特、高质量的游戏艺术。 Scenario 的突出特点之一是它的微调能力。此功能允许您根据您独特的风格和艺术方向训练人工智能模型。您只需上传训练数据,人工智能就会学习数据中的图案、颜色或
Ludo.ai 官网地址 ludo.ai 人机协作加速游戏创意,游戏概念的生产车间。 主要目的是帮助我们完成一份游戏设计文档。用户可以根据关键词、游戏名称、相似游戏等方式查找灵感。 最大的方便是提供了一个模板,在模板上提供了输入控件,从而联动AI功能。 技术上,是基于100万款游戏的数据集,使用机器学习和自然语言处理进行处理。