达摩 text-to-video-ms-1.7b 文本生成视频
达摩 text-to-video-ms-1.7b 文本生成视频安装123456789101112conda create -n videoai python=3.9 -yconda activate videoaipip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118p
达摩 text-to-video-ms-1.7b 文本生成视频安装123456789101112conda create -n videoai python=3.9 -yconda activate videoaipip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118p
stable diffusion 原理Stable Diffusion 的数据会在像素空间(Pixel Space)、潜在空间(Latent Space)、条件(Conditioning)三部分之间流转,其算法逻辑大概分这几步 图像编码器将图像从像素空间(Pixel Space)压缩到更小维度的潜在空间(Latent Space),捕捉图像更本质的信息; 对潜在空间中的图片添加噪声,进行扩散过
Contrastive Language-Image Pre-training(CLIP)https://blog.csdn.net/weixin_53297048/article/details/130719092 一种基于对比文本-图像对的预训练方法或者模型。 CLIP包括两个模型:Text Encoder和Image Encoder,其中Text Encoder用来提取文本的特征,可以采用
潜在扩散模型(LDM / Latent Diffusion Model)https://zhuanlan.zhihu.com/p/595909681?utm_id=0 在计算机眼中,一张 512x512 分辨率的图片,就是一组 512 * 512 * 3 的数字,如果直接对图片进行学习,相当于 AI 要处理 786432 维的数据,这对算力、计算机性能要求很高。 可以将图片映射到潜在空
AudioLDM2 音频生成安装12345678910conda create -n audiocraft python=3.9 -yconda activate audiocraftpip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118python>>&g
Mermaid 绘制流程图.mmd 文件 Mermaid 是一个用于画流程图、状态图、时序图、甘特图的库,使用 JS 进行本地渲染,广泛集成于许多 Markdown 编辑器中。 官网:https://mermaidjs.github.io/ Github 项目地址:https://github.com/knsv/mermaid Mermaid 支持多种图表的方向,语法如下: 12graph 方
Jupyter Notebookhttps://zhuanlan.zhihu.com/p/33105153 Jupyter Notebook是以网页的形式打开,可以在网页页面中直接编写代码和运行代码,代码的运行结果也会直接在代码块下显示的程序。如在编程过程中需要编写说明文档,可在同一个页面中直接编写,便于作及时的说明和解释。 这些文档是保存为后缀名为.ipynb的JSON格式文件,不仅便于版本控
Nodejs 生成18位唯一数字使用 nanoid,老版本 3.0.2 是可以使用require的,目前的==最新版nanoid只支持import,不支持require== npm install -S nanoid@3.0.2 123const { customAlphabet } = require('nanoid
Meta audiocraft 超强文本转音乐https://dyss.top/1087 安装1234567891011conda create -n audiocraft python=3.9 -yconda activate audiocraftpip install torch torchvision torchaudio --index-url https://download.pyto
stable diffusion webui 安装 gfpgan 失败的解决方案https://blog.csdn.net/weixin_40735291/article/details/129153398 直接到github下载 GFPGAN 代码到本地,并进行本地安装 https://gitcode.net/mirrors/TencentARC/GFPGAN?utm_source=csd
VSCode 调试开发 Unity VSCode 插件安装 .NET Install Tool for Extension Authors 版本:v1.6.0 厂商:Microsoft C# ==版本:v1.24.1== 最新版本2.0的不行,导致没有提示 厂商:Microsoft C# Dev Kit 版本:v0.3.21 厂商:Micro
AI 机器学习的专业算法研究网站==https://paperswithcode.com/sota== 查找论文对应开源代码的神器(Papers with Code) paperswithcode 是一站式的门户网站,可访问包括机器学习模型、数据集、方法、评估表和代码在内的开源资源,了解当下最先进的研究论文,幸运的话会有相应的数据集和代码。 可以通过使用平台上面的代码重现论文
如何用AI提升自己的业务能力https://www.sohu.com/a/707835568_99922069 用AI解决问题的能力落实到场景中,就是用AI提升业务能力。用AI提升业务能力包括三个关键要素:第一,要提升核心竞争力。 第二,要用AIGC来助力。 第三,要提升业务实战能力。 提升核心竞争力 职场核心竞争力包括哪些? 第一个核心能力是市场分析力。要知道市场的外部发生了哪些变化,掌握
10款最佳人工智能游戏生成器https://mp.weixin.qq.com/s/9XIzXob6kuQIR7CqpmP-Zw Scenario https://www.scenario.com/ Scenario 是一款由人工智能驱动的工具,为游戏艺术创作提供了一套全面的功能。它旨在帮助游戏开发者创建符合其风格和艺术方向的独特、高质量的游戏艺术。Scenario 的突出特点之一是它的微调能
Ludo.aihttp://ludo.ai/ ludo.ai 人机协作加速游戏创意,游戏概念的生产车间。 主要目的是帮助我们完成一份游戏设计文档。用户可以根据关键词、游戏名称、相似游戏等方式查找灵感。 最大的方便是提供了一个模板,在模板上提供了输入控件,从而联动AI功能。 技术上,是基于100万款游戏的数据集,使用机器学习和自然语言处理进行处理。