人工智能艺术

✍ dations ◷ 2025-09-08 18:39:22 #人工智能艺术

人工智能艺术,通称AI艺术,是指通过使用人工智能创造的任何艺术品。

创造人工智能艺术的方式共有多种方法,包括使用数字模式的程序“基于规则”的图像生成、模拟笔触和其他绘画效果的算法,以及人工智能或深度学习算法等。

最早的重要人工智能艺术系统之一是AARON(英语:AARON),由哈罗德·科恩(英语:Harold Cohen)于1960年代末开始开发。 AARON也是符号人工智能艺术最著名的例子,该系统使用基于符号规则的方法来生成技术图像。科恩最初开发AARON的目的,则是令人工智能能够对绘图行为进行编码。AARON先是以原始形式创作简单的黑白图画。后来再通过科恩绘画以完成图画。 此后,他还开始为AARON开发一种绘画方式。在无需后续人工调解的方式下,科恩特地将AARON设计仅令使用程序本身选择的特殊画笔和染料从而进行绘画。


自2014年开始,生成对抗网络(GAN)经常被AI艺术家所使用。该系统能够使用“生成器”来创建新图像,并使用“鉴别器”来决定哪些创建的图像被认为是成功的。最近的模型则使用向量量化生成,以对抗网络和对比文笔-图像生成训练(VQGAN+CLIP)。

Google于2015年发布的DeepDream(英语:DeepDream),则是使用卷积神经网络通过算法错视,以查找和增强图像中的模式,从而创建故意过度处理的图像。 在DeepDream发布后,几家公司也发布了可以将照片转换为具有知名画集风格艺术图像的应用程序。

几个AI制图程序透过各种文本提示工程以生成各种图像。包括OpenAI的DALL-E、 谷歌大脑的Imagen和Parti(2022年5月发布)以及微软的NUWA-Infinity。其输入形式还可以包括图像和关键字和/或配置参数,例如通常通过关键短语输入艺术风格,例如“in the style of {name of an artist}”的提示,或著是/广泛的审美/艺术风格元素的选择。

当前,也日益出现其他AI艺术的生成程序,包括简单面向消费者的移动应用程序和Jupyter笔记本,不过多数程序需要强大的图形处理器才能有效运行。其知名案例则包括Midjourney(英语:Midjourney)、StyleGAN(英语:StyleGAN)和Stable Diffusion等。2022年8月22日,Stable Diffusion正式发布,使该程序的技术更容易获得且可以在个人硬件上免费使用,也可以由第三方程式(即其他项目)扩展。这使得来自世界各地的开发人员,能够进一步创新应用程序和扩展。例如运用于Krita的插件、Adobe Photoshop、Blender和GIMP等自由图像软件。

Automatic1111 Stable Diffusion UI是一种基于网络的开源用户界面,用于让用户在自己的计算机上使用工具,包括不断集成的AI算图新功能(例:修复或文本反转)Stability.ai 的网络界面,允许在没有任何新安装的情况下运行DreamStudio软件。

2022年8月,一幅网名为Sincarnate的用户使用Midjourney生成的画作,在美国科罗拉多州博览会夺下Fine Arts Exhibition数字艺术首奖。

对此,一位专家得出结论认为:“人工智能艺术现在已经无处不在,甚至连专家都不知道这意味着什么。”,一家新闻媒体则以“人工智能产生的艺术繁荣”为报导主题,并采访对于著作权、人工智能自动化问题表示意见的专业艺术家们,一家新闻媒体则调查网络社区面对此类艺术​​品的反应,并对人工智能艺术及深伪技术的持续发展表示担忧,一家杂志则是强调人工智能技术“在实现新艺术形式”的“可能性表达”,并指出该技术可能被视为一种“人类能力上的增强” 。其例子包括允许业余爱好者制作扩展非商业利基类型的作品(常见例子为赛博朋克派生品)、或是产生新颖的娱乐、能够非常快速的时间制作艺术原型,能够提升生成草稿、灵感、草稿改进和图像的时间。

不过,当前一些艺术网站正在禁止AI生成或AI辅助的艺术,尽管有些平台,如Pixiv则允许发布,但仍必须要将该艺术被标记为AI艺术。

包括AI艺术在内的合成媒体,也在2022年被描述为影响未来几年业务的主要技术驱动趋势。

有一些平台可以共享、交易、搜索、分叉/精炼和或是协作,以协助图像生成器借由提示生成特定图像。该提示通常与图像共享(英语:Image_sharing)网站(例如 reddit和AI艺术专用网站)上共享。

正在开发、具有现有原型或已经使用人工智能艺术的应用程序还包括:

当前,人工智能艺术的其他功能仍在开发中,开发工作室经常改进各种应用程序或激活新功能,例如“文本反转”是指激活从少数图像中学习的用户提供的概念(如对像或样式) 。通过文本倒置,可以从关系的词(已分配学习的、通常是抽象概念的关键字)对于原型扩展/微调(其案例包括DreamBooth)。

由人工智能生成的图像 ,有时能够用作草图、低成本实验、或概念验证阶段构想的说明,附加功能或改进也可以在图像生成后由用户自行手动编辑,进行修改。在Stable Diffusion的情况下,主要的预先训练模型,基本在使用机器学习构建应用程序的工具平台Hugging Face Hub(英语:Hugging_Face#Hugging_Face_Hub)上共享。

人工智能艺术领域的一个关键部分,是音乐和人工智能之间的关系,至今的人工智能技术能够开发使用AI制作音乐的软件程序。

与其他领域的应用一样,音乐中的AI也能模拟脑力任务。一个突出的特点是,人工智能算法能够根据过去的数据进行学习,比如在计算机伴奏技术中,人工智能能够听取人类表演者的演奏并进行伴奏。人工智能还推动了交互式作曲技术,计算机能够根据现场表演创作音乐。音乐领域还有其他人工智能应用,不仅涵盖音乐创作、制作和表演,还涵盖整个音乐的营销和消费方式。如开发了几种音乐播放器程序,以使用语音识别和自然语言处理技术,以进行音乐语音的控制。

人工智能可用于可调节地生成新颖的声音样本,艺术家可以将其用于音乐曲目。

一些原型机器人可以创造被认为是人工智能艺术形式的作品。除了文案编辑之外,还有部分AI程序也能辅助写作(包括对于虚构故事的生成,帮助作家在脑闭塞、没有灵感或重写片段)。

人工智能艺术可以用于游戏视觉艺术(英语:Artificial_intelligence_in_video_games#Uses_in_games_beyond_NPCs),特别是用于关卡设计(例如自定义地图、游戏模块)和在影像游戏中创建新内容或交互故事。

2018年,佳士得纽约拍卖行举办了一场人工智能艺术品拍卖会,其中艺术品《埃德蒙德贝拉米(英语:Edmond_de_Belamy)》以432,500美元的价格售出,比其估价7,000至10,000美元高出近45倍。这件艺术品是由总部位于巴黎的团体“Obvious”创作的。

2022年9月,深度学习文生图模型Stable Diffusion和Midjourney推出插画集《Artificial AI Art Collection by Images Midjourney / Stable Diffusion》,该书籍共有852页。是日本第一部完全由AI生成的绘画作品组成的插画集。

自从艺术家在20世纪开始使用人工智能创作艺术以来就引发了许多争论。2020年代,其中一些争论涉及人工智能艺术是否可以被定义为真正的艺术以及它对艺术家的影响。

1985年,潘蜜拉·萨缪尔森(英语:Pamela Samuelson)考虑了与著作权相关的AI艺术作者身份相关的法律问题:当人工智能创作艺术作品时,谁拥有著作权?在萨缪尔森的文章中,则认为将从于计算机生成的作品中分配所有权,认为权利应该分配给进行生成程序的用户。维克多·宫(Victor Palace)则提出了三种可能的选择。首先,若是人工智能本身成为著作权所有者。为此需要修改著作权法第101条,将“作者”定义为自然人或电脑。其次,按照萨缪尔森的论点,用户、程序员或人工智能公司也是著作权所有者。这将是“雇佣作品”学说的扩展,根据该学说,著作权的所有权将会转移给“雇主”。最中没有人成为著作权所有者,该作品将会自动进入公有领域。该论点认为,因为没有人‘创造’了这件艺术品,所以没有人应该是著作权所有者。

英国公司设计与艺术家著作权协会(英语:Design_and_Artists_Copyright_Society)的雷玛·赛尔希(Reema Selhi)于2022年9月表示:“没有任何保障措施,可以让艺术家能够识别数据库中正在使用的作品并选择退出。”。

一些艺术家在2022年对人工智能艺术可能对其商业能力产生的影响表示担忧,特别是可能将被人工智能取代从事插画和设计的艺术家。据英国工会Equity(英语:Equity_(British_trade_union))称:共有“65%的表演者认为,人工智能技术的发展对表演艺术领域的就业机会构成威胁。”

数字艺术家RJ·帕默(RJ Palmer)表示:“我可以很容易地设想这样一个场景,即使用 AI,单个艺术家或艺术总监便可以取代约5-10名入门级艺术家……我见过很多自行出版的作者,他们说如果他们因为AI技术的存在,因而再也不必聘请艺术家。”同时帕默补充说道:“为小型创作者做这种工作,是我们中的许多人开始成为专业艺术家的方式。”波兰数字艺术家格雷格·鲁特科夫斯基(Greg Rutkowski)则表示:“它一开始看起来像是对我们职业的威胁”,并补充可能使用户在搜索艺术家的作品变得越来越困难,透过搜索引擎许多图像,可能也会出现提示模仿他的风格而生成的AI作品。

自19世纪出现修饰照片技术以来,21世纪初的一些人士一直担心人工智能艺术可能被用来创建具有误导性的内容,即所谓的“深伪技术”的风险。

一位浑身湿透的太空人,撑著一把白色的雨伞在月球表面的倾盆大雨中行走的作品

机械鸽子

一个孤独的蓝色男子,以胎儿的姿态蜷缩在虚无中

耶稣基督在大麻田上的图像

威尼斯受到轰炸的模拟图像

森林。

AI生成的赛博朋克城市景观艺术

以神经风格所绘制的摩天大楼

相关

  • 满足满足(英语:contentment)是一种心理或情感上的满意状态,可能来自于在一个人的处境、身体和心灵中的安逸(英语:Inner peace)。通俗地说,满足可以是一种接受自己处境的状态,是一种更温和
  • 犬细小病毒犬细小病毒2型(Canine parvovirus type 2 ,CPV2)是一种主要感染犬的传染性病毒。该病传染性强。犬之间通过对于其粪便的直接或间接接触而传播该病。没有母源抗体或疫苗保护的幼
  • 勃印曩勃印曩(缅甸语:ဘုရင့်နောင်,缅甸语委转写:,意为“王兄”;1516年1月16日-1581年10月10日),又译勃应曩,《明史》称之为莽应龙,全名勃印曩瑙亚塔明绍(缅甸语:ဘုရင့်နော
  • 李缜李缜可以指:
  • 谭继洵谭继洵(1823年-1900年),字信甫、敬甫,湖南省浏阳县(今长沙市)人,戊戌维新推行者之一谭嗣同之父。谭学琴的第三个儿子,父亲过世后,由长兄谭继昇兼代父职,道光二十九年(1849年)中举人,咸丰十
  • 刀安仁刀安仁(1872年-1913年),又名郗安仁,字沛生,中国云南德宏盈江新城人,傣族,第二十二代干崖土司,清末民初革命家。1906年,刀安仁在日本东京加入中国同盟会,1908年回到干崖,组织同盟会支部,两
  • 普鲁士的安娜·阿玛莉埃普鲁士的安娜·阿玛莉埃(德语:,1723年11月9日—1787年3月30日),奎德林堡女隐修院院长,腓特烈大帝的妹妹。安娜·阿玛莉埃和姐姐路易丝·乌尔莉卡曾是瑞典王储阿道夫·腓特烈的妻子
  • 黑山的米尔科黑山的米尔科,全名米尔科·彼得罗维奇-涅戈什(塞尔维亚语:Мирко Петровић Његош,1879年4月17日-1918年3月2日),黑山国王尼古拉一世的次子。1902年,米尔科与娜塔莉
  • 765年
  • 三尊三尊,又称为三圣,是东亚佛教、道教和民间信仰的神佛造像术语。三尊形式最早起源于印度,是呈现神佛造像的一种方式,以中尊为主,左右二尊胁侍,表彰中尊之功德、协助教化众生。“尊”是佛教、道教对神佛尊敬的量词,日本神道对神的量词称为“柱”。胁侍可以是菩萨、声闻、明王、天人、童子等,常见组合如下:早期道教文化中并没有崇拜神像的需求,所以道教的造像要晚于佛教。现存最古老的道教造像,制成于南北朝的北魏时期。陶弘景在茅山建筑佛、道二堂,交互进行礼敬,但佛堂之中安置有尊佛,道堂之中没有;所以陶弘景模仿佛教造像,在道堂中制作