一位年轻工程师用人工智能技术圆音乐创作梦

作为一名具备音乐创作和表演能力的信息技术工程师,阮黄保大(图中)这位1994年生的年轻人常被人们称作“懂代码的作曲家”。
一位年轻工程师用人工智能技术圆音乐创作梦 ảnh 1阮黄保大,1994年生的年轻人常被人们称作“懂代码的作曲家”。图自互联网

越通社河内——作为一名具备音乐创作和表演能力的信息技术工程师,阮黄保大(图中)这位1994年生的年轻人常被人们称作“懂代码的作曲家”。

不久前,他凭借基于人工智能技术的音乐创作模型成为被谷歌承认为其计算机科学开发技术专家的第三个越南人,成为了越南信息技术界的骄傲。

在胡志明市自然科学大学攻读计算机科学专业之后,阮黄保大成为研究自然语言处理和计算机视觉领域的人工智能的工程师,但他从未放弃从小对音乐的情有独钟。由他创作和表演的音乐短视频《IT一族》颇受技术工作者的青睐,在YouTube上获得数万人次的观看。

保大说,他有先作曲后作词的习惯。这也是他倾注最多的心血和时间的环节,因为他认为一个好的歌曲,首先要有优美的旋律。对于很多歌曲,他要花了个把月时间才完成曲子,因为要反复修改、精雕细琢。鉴于这样的现实,年轻的工程师突发奇想,打算用学到关于人工智能的专业知识来支持实现自己的音乐梦想。保大分享说:“我想人工智能能够画画,那也可以作曲。因此,我打算根据越南人的爱好和习惯设计一个针对越南人的人工智能作曲模型”。

2017年初,他正式着手研究。在两年探索、研究和尝试之后,人工智能创作音乐的模型正式问世,以一秒钟写出十首曲子的能力给人们带来惊喜。有了这个模型,作曲家只需要给出几个音符,系统就会对数据进行处理,将输入的旋律转换成各种更长的旋律。人工智能随机算法允许系统将生成完全不同的旋律版本,供听者选择,从而根据需要进行调整。该模型通过提供启发灵感的建议帮助音乐家缩短旋律制作过程,让音乐家有更多时间专注于其余环节,如和声、编曲、写词。

保大说,世界上也有了对音乐中人工智能模型的研究,但这些模型主要面向古典音乐创作,与越南人的音乐爱好有着很大不同。因此,为了打造以人工智能创作适合越南人的流行音乐、流行民谣等歌曲类型的模型,他不得不建立自己的算法。这位“工程师作曲家”面临的最大挑战是如何找到足够大的输入数据源来训练模型。想让模型具备流行音乐创作能力,就要有流行音乐的数据来源。

为此,保大只好花好几天的时间在电钢琴上弹奏和录制越南流行歌曲的旋律,并将其处理成MIDI格式。在该模型使用的三万首歌曲文件中,只有5000首是保大从朋友分享的音乐论坛上找到的,其余多达2.5万首是他自己弹奏来规范数据的。有时候,他好几天彻夜不眠,为的是重新弹奏二三百首歌曲。

此外,还要面临操作系统的挑战,因为普通的台式电脑或笔记本电脑没有足够的计算能力来训练人工智能,如果投入一整套计算机,这位年轻工程师就承担不起这个成本。拿出全部的积蓄,保大选择了租用电脑、使用云计算和按需付费的方式。在打造模型的过程中,他希望拥有既懂音乐、又具备人工智能技能的同伴,但找到满足这些条件的人似乎太难了。一个人单独拼搏有点艰难,但功夫不负有心人,这位年轻工程师的科研成果真正让所有人十分钦佩。

对于人工智能作曲模型的优越性是否导致对技术依赖度增加、作曲家音乐创作能力受限的问题,保大坦率地说,该模型的本质是帮助创作者通过对比和选择的过程节省作曲时间,但绝不是用来取代作曲家工作的全能工具。每个音乐作品必须带有风格、情感和个人印记,才能站稳脚跟,因此音乐工作者主导创作的作用是不可或缺的。

阮黄保大说,今后为了优化模型的功能,他将继续研究开发制作和弦、写词等能力,使该模型成为音乐创作者的得力助手。(来源:越南《人民报》)
越通社

更多

科学技术新闻奖颁奖仪式现场。图自越通社

第57号决议:北宁省推动科技知识价值渗透到社会各方面

12月19日,北宁省人民委员会举行了2025年创新创业节(Techfest)闭幕式、科学技术新闻奖颁奖仪式以及北宁省数字公民竞赛颁奖仪式。这些活动具有切实意义,展现了该省构建创新生态系统、推动科技应用、数字化转型、发展数字公民的决心,从而让科技知识价值在社会各个层面上传播开来。

VinSpeed高速列车。图自VinSpeed

西门子将为VinSpeed提供高速列车

Vingroup集团的VinSpeed与西门子交通有限公司(Siemens Mobility GmbH,隶属德国西门子集团)签署了高速铁路领域中战略合作与技术转让协议。

医生正在测试用于癌症治疗的直线加速器放射治疗系统的运行情况。图自越通社

原子能在多行业多领域的应用方向

12月17日,越南政府副总理阮志勇签署第2736/QĐ-TTg号决定,批准《2030年前原子能发展与应用规划实施计划,远景展望至2050年》(以下简称《计划》)。

资料图。图自越通社

2025年越南吸引外资目标实现可能性很大

越南财政部统计局的统计数据显示,2025年前11月,越南吸引外商直接投资(FDI、外资)总额达336.9亿美元,同比增长7.4%;其中,流入加工制造业的外资达185.2亿美元,占注册资本总额的近55%。这一数字进一步彰显加工制造业在越南吸引外资格局中的核心地位。

研讨会现场。图自越通社

系列新决策为和乐高科技园区发展注入强劲动力

12月16日,越南财政部经济财政战略与政策研究院在河内举行了“2030年及展望至2045年和乐高科技园区发展方向和解决方案”研讨会。该活动是落实河内市科学方案《推动和乐高科技园区发展的解决方案》框架内的一部分。

2025年越南国家创新创业节上的科技产品展区。图自越通社

第57号决议:创新创业是全民的共同事业

在全国加快落实越共中央政治局于2024年12月22日签发关于推动国家科技、创新和数字化转型突破发展的第57号决议(57-NQ/TW),旨在建设“全民创业—全民创新”国家的背景下,由越南科学与技术部同河内市人民委员会联合举办的2025年越南国家创新创业节(Techfest Vietnam 2025),被视为一个新的里程碑:从专业性活动升级为社区创新盛会。

2025年互联网日活动:数字信任的四大支柱

2025年互联网日活动:数字信任的四大支柱

根据国际排名数据显示,截至2025年10月,越南固定宽带互联网速度位居全球第10位,移动宽带互联网速度排名第15位。5G网络覆盖全国59%的人口,为发展数字经济、数字政府和数字社会奠定了重要基础。

越南和老挝代表合影。图自越通社

越老深化科教合作

值此庆祝老挝人民民主共和国国庆50周年(1975年12月2日—2025年12月2日)暨老挝人民民主共和国主席凯山·丰威汉诞辰105周年(1920年12月13日—2025年12月13日)之际,沙湾拿吉省教育与体育厅与老越友谊学校于12月15日在凯山·丰威汉市联合举办“2025年度高中VR机器人竞赛”。

附图。图自越通社

第57号决议:从AIM创新教育模式到促进知识产权商业化

越共中央政治局2024年12月22日发布关于实现科技、创新和国家数字化转型突破发展的第57-NQ/TW号决议强调充分发挥人类智力资源的优势;2025年8月22日发布关于教育与培训突破性发展的第71-NQ/TW号决议则明确提出大力推进普通教育改革,提升学生数字能力、创新思维和创新技能的目标。