2024

笔记

2024-08-29

达摩 text-to-video-ms-1.7b 文本生成视频

达摩 text-to-video-ms-1.7b 文本生成视频安装1234567891011conda create -n videoai python=3.9 -yconda activate videoaipip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118pyth

笔记

2024-08-27

stable diffusion 原理

stable diffusion 原理Stable Diffusion 的数据会在像素空间（Pixel Space）、潜在空间（Latent Space）、条件（Conditioning）三部分之间流转，其算法逻辑大概分这几步：图像编码器将图像从像素空间（Pixel Space）压缩到更小维度的潜在空间（Latent Space），捕捉图像更本质的信息对潜在空间中的图片添加噪声，进行扩散过

笔记

2024-08-25

Contrastive Language-Image Pre-training(CLIP)

Contrastive Language-Image Pre-training(CLIP)学习资源 CSDN文章简介一种基于对比文本-图像对的预训练方法或者模型。 CLIP包括两个模型： Text Encoder：用来提取文本的特征，可以采用NLP中常用的text transformer模型 Image Encoder：用来提取图像的特征，可以采用常用CNN模型或者vision transf

笔记

2024-08-23

潜在扩散模型（LDM / Latent Diffusion Model）

潜在扩散模型（LDM / Latent Diffusion Model）学习资源知乎文章简介在计算机眼中，一张 512x512 分辨率的图片，就是一组 512 * 512 * 3 的数字，如果直接对图片进行学习，相当于 AI 要处理 786432 维的数据，这对算力、计算机性能要求很高。可以将图片映射到潜在空间（Latent Space）后进行扩散和逆扩散学习。如何理解 “潜在空

笔记

2024-08-21

AudioLDM2 音频生成

AudioLDM2 音频生成安装123456789conda create -n audiocraft python=3.9 -yconda activate audiocraftpip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118python>>>

笔记

2024-08-19

Mermaid 绘制流程图

Mermaid 绘制流程图.mmd 文件Mermaid 是一个用于画流程图、状态图、时序图、甘特图的库，使用 JS 进行本地渲染，广泛集成于许多 Markdown 编辑器中。项目资源官网地址 GitHub项目地址语法说明Mermaid 支持多种图表的方向，语法如下： 12graph 方向描述图表中的其他语句... 示例1234567graph TB id1(圆角矩形)--普

笔记

2024-08-17

Jupyter Notebook

Jupyter Notebook学习资源知乎文章简介Jupyter Notebook是以网页的形式打开，可以在网页页面中直接编写代码和运行代码，代码的运行结果也会直接在代码块下显示的程序。如在编程过程中需要编写说明文档，可在同一个页面中直接编写，便于作及时的说明和解释。这些文档是保存为后缀名为.ipynb的JSON格式文件，不仅便于版本控制，也方便与他人共享。此外，文档还可以导出为：HT

笔记

2024-08-15

Nodejs 生成18位唯一数字

Nodejs 生成18位唯一数字使用 nanoid，老版本 3.0.2 是可以使用require的，目前的最新版nanoid只支持import，不支持require 1npm install -S nanoid@3.0.2 123const { customAlphabet } = require('nanoid')const nanoid = custo

笔记

2024-08-13

Meta audiocraft 超强文本转音乐

Meta audiocraft 超强文本转音乐学习资源参考文章安装步骤123456789conda create -n audiocraft python=3.9 -yconda activate audiocraftpip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu

笔记

2024-08-11

stable diffusion webui 安装 gfpgan 失败的解决方案

stable diffusion webui 安装 gfpgan 失败的解决方案学习资源 CSDN解决方案解决方案步骤直接到github下载 GFPGAN 代码到本地，并进行本地安装 GitHub镜像地址下载后，解压（如果用git clone就不需要）到 d:\stable-diffusion-webui\venv\Scripts 目录下打开cmd，cd 到 d:\stable-

笔记

2024-08-09

VSCode 调试开发 Unity

VSCode 调试开发 Unity1. VSCode 插件安装 .NET Install Tool for Extension Authors 版本：v1.6.0 厂商：Microsoft C# 版本：v1.24.1 (最新版本2.0的不行，导致没有提示) 厂商：Microsoft C# Dev Kit 版本：v0.3.21 厂商：Microsoft Unity 版本：v0.9

笔记

2024-08-07

AI 机器学习的专业算法研究网站

AI 机器学习的专业算法研究网站 Papers with Code 查找论文对应开源代码的神器(Papers with Code) paperswithcode 是一站式的门户网站，可访问包括机器学习模型、数据集、方法、评估表和代码在内的开源资源，了解当下最先进的研究论文，幸运的话会有相应的数据集和代码。可以通过使用平台上面的代码重现论文的结果，使用模型性能指标检查所有先前的实现，查看研究论文

笔记

2024-08-05

如何用AI提升自己的业务能力

如何用AI提升自己的业务能力学习资源参考文章用AI提升业务能力的三个关键要素用AI解决问题的能力落实到场景中，就是用AI提升业务能力。用AI提升业务能力包括三个关键要素：第一，要提升核心竞争力职场核心竞争力包括哪些？市场分析力：要知道市场的外部发生了哪些变化，掌握它的动态，很多做销售的人都缺乏市场分析力，或者有想法难以实践。用户洞察力：现在的产品，同质化越来越高，实现高转化率和复购

笔记

2024-08-03

10款最佳人工智能游戏生成器

10款最佳人工智能游戏生成器学习资源参考文章 1. Scenario 官网地址 Scenario 是一款由人工智能驱动的工具，为游戏艺术创作提供了一套全面的功能。它旨在帮助游戏开发者创建符合其风格和艺术方向的独特、高质量的游戏艺术。 Scenario 的突出特点之一是它的微调能力。此功能允许您根据您独特的风格和艺术方向训练人工智能模型。您只需上传训练数据，人工智能就会学习数据中的图案、颜色或

笔记

2024-08-01

Ludo.ai

Ludo.ai 官网地址 ludo.ai 人机协作加速游戏创意，游戏概念的生产车间。主要目的是帮助我们完成一份游戏设计文档。用户可以根据关键词、游戏名称、相似游戏等方式查找灵感。最大的方便是提供了一个模板，在模板上提供了输入控件，从而联动AI功能。技术上，是基于100万款游戏的数据集，使用机器学习和自然语言处理进行处理。

归档: 2024/8