一位年轻工程师用人工智能技术圆音乐创作梦

作为一名具备音乐创作和表演能力的信息技术工程师,阮黄保大(图中)这位1994年生的年轻人常被人们称作“懂代码的作曲家”。
一位年轻工程师用人工智能技术圆音乐创作梦 ảnh 1阮黄保大,1994年生的年轻人常被人们称作“懂代码的作曲家”。图自互联网

越通社河内——作为一名具备音乐创作和表演能力的信息技术工程师,阮黄保大(图中)这位1994年生的年轻人常被人们称作“懂代码的作曲家”。

不久前,他凭借基于人工智能技术的音乐创作模型成为被谷歌承认为其计算机科学开发技术专家的第三个越南人,成为了越南信息技术界的骄傲。

在胡志明市自然科学大学攻读计算机科学专业之后,阮黄保大成为研究自然语言处理和计算机视觉领域的人工智能的工程师,但他从未放弃从小对音乐的情有独钟。由他创作和表演的音乐短视频《IT一族》颇受技术工作者的青睐,在YouTube上获得数万人次的观看。

保大说,他有先作曲后作词的习惯。这也是他倾注最多的心血和时间的环节,因为他认为一个好的歌曲,首先要有优美的旋律。对于很多歌曲,他要花了个把月时间才完成曲子,因为要反复修改、精雕细琢。鉴于这样的现实,年轻的工程师突发奇想,打算用学到关于人工智能的专业知识来支持实现自己的音乐梦想。保大分享说:“我想人工智能能够画画,那也可以作曲。因此,我打算根据越南人的爱好和习惯设计一个针对越南人的人工智能作曲模型”。

2017年初,他正式着手研究。在两年探索、研究和尝试之后,人工智能创作音乐的模型正式问世,以一秒钟写出十首曲子的能力给人们带来惊喜。有了这个模型,作曲家只需要给出几个音符,系统就会对数据进行处理,将输入的旋律转换成各种更长的旋律。人工智能随机算法允许系统将生成完全不同的旋律版本,供听者选择,从而根据需要进行调整。该模型通过提供启发灵感的建议帮助音乐家缩短旋律制作过程,让音乐家有更多时间专注于其余环节,如和声、编曲、写词。

保大说,世界上也有了对音乐中人工智能模型的研究,但这些模型主要面向古典音乐创作,与越南人的音乐爱好有着很大不同。因此,为了打造以人工智能创作适合越南人的流行音乐、流行民谣等歌曲类型的模型,他不得不建立自己的算法。这位“工程师作曲家”面临的最大挑战是如何找到足够大的输入数据源来训练模型。想让模型具备流行音乐创作能力,就要有流行音乐的数据来源。

为此,保大只好花好几天的时间在电钢琴上弹奏和录制越南流行歌曲的旋律,并将其处理成MIDI格式。在该模型使用的三万首歌曲文件中,只有5000首是保大从朋友分享的音乐论坛上找到的,其余多达2.5万首是他自己弹奏来规范数据的。有时候,他好几天彻夜不眠,为的是重新弹奏二三百首歌曲。

此外,还要面临操作系统的挑战,因为普通的台式电脑或笔记本电脑没有足够的计算能力来训练人工智能,如果投入一整套计算机,这位年轻工程师就承担不起这个成本。拿出全部的积蓄,保大选择了租用电脑、使用云计算和按需付费的方式。在打造模型的过程中,他希望拥有既懂音乐、又具备人工智能技能的同伴,但找到满足这些条件的人似乎太难了。一个人单独拼搏有点艰难,但功夫不负有心人,这位年轻工程师的科研成果真正让所有人十分钦佩。

对于人工智能作曲模型的优越性是否导致对技术依赖度增加、作曲家音乐创作能力受限的问题,保大坦率地说,该模型的本质是帮助创作者通过对比和选择的过程节省作曲时间,但绝不是用来取代作曲家工作的全能工具。每个音乐作品必须带有风格、情感和个人印记,才能站稳脚跟,因此音乐工作者主导创作的作用是不可或缺的。

阮黄保大说,今后为了优化模型的功能,他将继续研究开发制作和弦、写词等能力,使该模型成为音乐创作者的得力助手。(来源:越南《人民报》)
越通社

更多

河内统一股份公司用于检测自行车车圈的自动检测设备。图自越通社

推动科技、创新与数字化转型真正成为经济增长的核心动力

近年来,党和国家多项重大主张和政策已明确要求,从传统发展模式向基于科技、创新和数字化转型的可持续发展模式转型。然而,为了让科技、创新和数字化转型真正成为推动经济增长的核心动力,需要采取更多配套措施,推动相关主张、政策和法律落地见效。

芹苴市公安局内部政治安全处向芹苴市大学生提供关于网络安全知识。图自越通社

为青年群体筑牢“数字盾牌” 防范深度伪造风险

自2026年7月1日起,2025年《网络安全法》正式生效,标志着越南网络空间保护法律体系进一步完善的重要一步。值得关注的是,该法首次将数据安全、人工智能(AI)治理以及深度伪造(Deepfake)技术等相关内容纳入专门监管框架,对数字环境中组织和个人的责任提出了更高要求。

越南驻法国大使郑德海在会上发言。图自越通社

越法企业加强对接 推动人工智能转型

2026年越法企业论坛于6月18日在巴黎举行,吸引了数百名来自越南、法国及多个国家的企业领袖和技术专家参与,旨在共同探讨人工智能(AI)转型趋势、技术主权以及基于AI运营的企业模式。

岘港越南国际金融中心。图自越通社

岘港抢抓金融科技新机遇

2026年Web3开发者峰会(Web3 Builders’ Summit 2026)显示,越南对Web3的认知方式正在发生变化。开发者社区不再聚焦于加密货币或数字资产投机活动,而是日益注重构建数字基础设施、实际应用和具备可持续运营能力的产品生态系统。

林同省游客在富贵特区主权旗台景点扫描二维码,快速获取旅游信息。图自越通社

越南以人工智能和数据加速旅游业数字化转型

越南政府刚签发关于批准《2026-2030年阶段数字经济和数字社会发展计划》 的第1033/QĐ-TTg号决定,其中制定旅游领域的重点为:在住宿、旅行、餐饮、景点等旅游设施的治理和运营中应用数字技术,进而提升游客体验质量。

科学技术部副部长范德隆在会上发言。图自西贡解放报

越南下一代互联网IPv6转换率位居全球前列

越南的IPv6使用率已达67.68%,在东盟地区位居第二,在全球排名第七,位居全球IPv6转换先锋国家行列,甚至超越诸多大国。越南拥有9500万宽带互联网用户且在IPv6网络下运行良好。

与会代表参观越南展位。图自越通社

2026年欧洲国际防务展:越南企业拓展参与全球技术价值链的机会

从6月15日至19日在巴黎举行的2026年欧洲国际防务展(Eurosatory 2026)汇聚了来自近100个国家的300多个官方代表团以及60多个国家的近2000家国防与安全企业。作为全球最大的陆上国防展会之一,Eurosatory被视为展示无人机、人工智能、电子作战、军事机器人以及现代安全与国防解决方案等领域最新技术趋势的平台。

人工智能、社交媒体与企业传播的重新定义

人工智能、社交媒体与企业传播的重新定义

在人工智能、社交媒体和多平台传播蓬勃发展的背景下,企业传播正进入一个前所未有的剧烈变革时期。在此环境下,企业不再是单纯“做广告”,而是必须学会管理形象、管理数据,最重要的是管理社会信任。

附图。图自Viettel Telecom

6月15日越南约1800万手机用户被单向停机

根据第08/2026/TT-BKHCN号通知规定,自6月15日起,各家运营商将对未进行实名登记的用户进行单向停机。这是按照国家管理机构规定管理用户的第一步,用户仍有时间完成实名登记以恢复全部服务。

尽管2025年网络攻击数量呈下降趋势,但遭受实际损害的组织比例却上升至52.3%。图自越通社

在数字时代保护数据安全

在数字时代,数据成为决定数字经济运行、国家竞争力和社会稳定的战略资源。与此同时,数据也是网络犯罪的首要攻击目标,旨在操纵行为、侵占资金流、扰乱社会信任并削弱国家的数字自主能力。

胡志明市医药大学副校长兼妇产科学系主任王氏玉兰和美德医院实验室主管黎黄英启与圣约瑟医院代表合影。图自tuoitre.vn

越南向法国转让辅助生殖技术

在从法国引进体外受精(IVF)技术近30年后,越南医生首次向曾经向越南传授该技术的法国医院转让辅助生殖技术。

双方会见场景。图自越通社

推动越日能源领域合作提质升级

6月12日下午,越南工贸部副部长阮黄龙在河内会见了日本出光兴产株式会社(Idemitsu Kosan,IKC)副首席执行官兼驻越总代表平野敦彦(Atsuhiko Hirano)。

海防国际门户港3号和4号集装箱码头的货物进出口。图自越通社

在新形势下发展物流人力资源

在物流基础设施不断完善、智能口岸模式逐步推进和数字供应链持续拓展的背景下,高素质人力资源将成为推动越南物流实现跨越式发展的关键因素。因此,发展物流人力资源不仅是教育机构或企业的任务,更是提升新纪元国家竞争力的战略任务