一位年轻工程师用人工智能技术圆音乐创作梦

作为一名具备音乐创作和表演能力的信息技术工程师,阮黄保大(图中)这位1994年生的年轻人常被人们称作“懂代码的作曲家”。
一位年轻工程师用人工智能技术圆音乐创作梦 ảnh 1阮黄保大,1994年生的年轻人常被人们称作“懂代码的作曲家”。图自互联网

越通社河内——作为一名具备音乐创作和表演能力的信息技术工程师,阮黄保大(图中)这位1994年生的年轻人常被人们称作“懂代码的作曲家”。

不久前,他凭借基于人工智能技术的音乐创作模型成为被谷歌承认为其计算机科学开发技术专家的第三个越南人,成为了越南信息技术界的骄傲。

在胡志明市自然科学大学攻读计算机科学专业之后,阮黄保大成为研究自然语言处理和计算机视觉领域的人工智能的工程师,但他从未放弃从小对音乐的情有独钟。由他创作和表演的音乐短视频《IT一族》颇受技术工作者的青睐,在YouTube上获得数万人次的观看。

保大说,他有先作曲后作词的习惯。这也是他倾注最多的心血和时间的环节,因为他认为一个好的歌曲,首先要有优美的旋律。对于很多歌曲,他要花了个把月时间才完成曲子,因为要反复修改、精雕细琢。鉴于这样的现实,年轻的工程师突发奇想,打算用学到关于人工智能的专业知识来支持实现自己的音乐梦想。保大分享说:“我想人工智能能够画画,那也可以作曲。因此,我打算根据越南人的爱好和习惯设计一个针对越南人的人工智能作曲模型”。

2017年初,他正式着手研究。在两年探索、研究和尝试之后,人工智能创作音乐的模型正式问世,以一秒钟写出十首曲子的能力给人们带来惊喜。有了这个模型,作曲家只需要给出几个音符,系统就会对数据进行处理,将输入的旋律转换成各种更长的旋律。人工智能随机算法允许系统将生成完全不同的旋律版本,供听者选择,从而根据需要进行调整。该模型通过提供启发灵感的建议帮助音乐家缩短旋律制作过程,让音乐家有更多时间专注于其余环节,如和声、编曲、写词。

保大说,世界上也有了对音乐中人工智能模型的研究,但这些模型主要面向古典音乐创作,与越南人的音乐爱好有着很大不同。因此,为了打造以人工智能创作适合越南人的流行音乐、流行民谣等歌曲类型的模型,他不得不建立自己的算法。这位“工程师作曲家”面临的最大挑战是如何找到足够大的输入数据源来训练模型。想让模型具备流行音乐创作能力,就要有流行音乐的数据来源。

为此,保大只好花好几天的时间在电钢琴上弹奏和录制越南流行歌曲的旋律,并将其处理成MIDI格式。在该模型使用的三万首歌曲文件中,只有5000首是保大从朋友分享的音乐论坛上找到的,其余多达2.5万首是他自己弹奏来规范数据的。有时候,他好几天彻夜不眠,为的是重新弹奏二三百首歌曲。

此外,还要面临操作系统的挑战,因为普通的台式电脑或笔记本电脑没有足够的计算能力来训练人工智能,如果投入一整套计算机,这位年轻工程师就承担不起这个成本。拿出全部的积蓄,保大选择了租用电脑、使用云计算和按需付费的方式。在打造模型的过程中,他希望拥有既懂音乐、又具备人工智能技能的同伴,但找到满足这些条件的人似乎太难了。一个人单独拼搏有点艰难,但功夫不负有心人,这位年轻工程师的科研成果真正让所有人十分钦佩。

对于人工智能作曲模型的优越性是否导致对技术依赖度增加、作曲家音乐创作能力受限的问题,保大坦率地说,该模型的本质是帮助创作者通过对比和选择的过程节省作曲时间,但绝不是用来取代作曲家工作的全能工具。每个音乐作品必须带有风格、情感和个人印记,才能站稳脚跟,因此音乐工作者主导创作的作用是不可或缺的。

阮黄保大说,今后为了优化模型的功能,他将继续研究开发制作和弦、写词等能力,使该模型成为音乐创作者的得力助手。(来源:越南《人民报》)
越通社

更多

政府总理范明政探访河内科技大学 图自越通社

落实第57号决议:完善高层次科学家队伍发展机制

发展高素质科技人力资源被确定为越南在新阶段掌握并发展战略性技术的核心任务。在实施关于发展科学技术、创新与数字化转型的第57-NQ/TW号决议一年后,如何完善高层次科学家队伍建设机制已成为亟待解决的关键课题。

中央肺科医院实施的一例肺移植手术。图自越通社

深度医学时代里的越南器官移植技术

经过三十多年的发展,越南全国器官移植技术与协调能力正在快速增长。从充满挑战的跨越越南的器官移植手术,到接近区域水平的专业技术,这一行业已为成千上万的患者带来了更多生存机会。

附图 图自越通社

2026年初越南互联网速度飞涨

据越南科学与技术部越南互联网中心(VNNIC)的i-Speed 测速平台的数据显示,2026年1月,移动宽带网络质量出现显著增长,尤其是5G网络。

越南军队电信集团(Viettel)旗下数据与人工智能服务中心的“AI追踪”解决方案获得美国专利。图自越通社

越南公司的“AI追踪”解决方案获得美国专利

越南军队电信集团(Viettel)旗下数据与人工智能服务中心(Viettel AI)26日公布,该中心首次获得了美国专利商标局(USPTO)颁发的实用专利。这项名为“用于视频中多目标追踪的深度学习方法”的专利,由越南人根据实际需求发明并掌握。

河内市人民委员会主席武大胜走访越南三星研发中心。图自越通社

为高科技项目创造便利环境

值此丙午年新春之际,2月25日下午,河内市人民委员会主席武大胜率团走访慰问并向河内市范围内的部分生产企业和高科技企业拜年。

资料图。图自互联网

Viettel Telecom获"移动行业奥斯卡"GLOMO大奖提名

越南军用电子电信总公司(Viettel Telecom)近日获得由GSMA颁发的全球移动通信领域权威奖项之一——GLOMO大奖提名。该公司凭借"连接越南2025:从2G到5G不让任何人掉队"的倡议,入围Tech4Good(技术向善)奖项单元。

附图 图自西贡解放报

区块链成为越南战略性数字基础设施

根据科技部于2025年10月8日发布的第3090/QĐ-BKHCN号决定所公布的《国家数字总体架构框架》,国家区块链平台(NDAChain)作为贯通中央至地方的统一数字基础设施,正逐步发挥成效。

附图 图自越通社

科技——开拓新增长空间的核心动力

在传统增长动力逐渐触及极限的背景下,转向基于科技、创新和数字化转型的增长模式,不仅是越南的选择,更成为其在新时期保持快速可持续发展的必然要求。