10月9日下午,瑞典皇家科学院决定将2024年诺贝尔化学奖授予三位科学家,其中,AI 模型AlphaFold2来预测蛋白质的复杂结构的技术成为全球焦点,48岁的谷歌 AI 大佬哈萨比斯和39岁的乔普获得了诺贝尔化学奖,这充分说明了AI在化学界的巨大潜力。本文总结了AI在化工过程的部分应用,体现了AI在提高行业效率、推动产业数智化作出的贡献。
一、AI在化学合成中的应用
自动化和实时反应监测已经实现了数据丰富的实验,这在应对化学合成的复杂性方面至关重要。将实时分析与机器学习及人工智能工具相结合,提供了加速确定最佳反应条件并促进无误自主合成的机会。
合成大多数分子需要进行多步转化,平衡材料数据的输入(如溶剂、试剂、催化剂)、反应参数(温度、添加顺序、时间)以及纯化策略。应对这种多因素挑战类似于在资源有限的迷宫中搜索。在历史上,化学家们不得不依靠以往的经验,制定谨慎的策略,并在有限的数据下做出决策。AI自动化技术改变了这一格局,极大地提高了分析反应数据的数量和准确性,使得在更短的时间内做出更好的决策成为可能。例如,高通量实验(HTE)技术可用于快速调查可能的反应条件,但这些技术通常只提供固定反应时间下的分析产率,放弃了与反应机理或动力学相关的关键细节。(如下图所示)
超高效液相色谱分析的Suzuki–Miyaura交叉偶联,显示了起始物和产物以及常见副产物随时间变化的不同峰面积。a,当捕获少量时间点时,获得了有限的理解。b,将相同的转化视觉化为完整的反应剖面,立即提供了反应的全面视图。a.u.,任意单位;XPhos Pd G2,氯(2-二环己基膦基-2′,4′,6′-三异丙基-1,1′-联苯)[2-(2′-氨基-1,1′-联苯)]钯(II);THF,四氢呋喃。
机器学习(ML)和人工智能(AI)工具是实验数据驱动工作流程的强大补充,可以加速识别反应条件。预测模型是从高通量实验(HTE)或文献来源获得的实验数据构建的,可以建议执行未知的转化的反应条件。此外,通过将机器学习优化算法与机器人反应执行、终点采样和数据提取融合,还创建了自主优化平台。使用这些方法,可以减少识别理想条件所需的实验数量,但这两个示例都将实验结果简化为单一的数量评分,如产率或立体选择性的百分比。这些策略具有一定的优点,但将实验结果简化为在固定时间内的单一测量结果掩盖了化学反应本身的复杂性。
许多研究已经表明,从现有文献中获取反应性能数据(产率)会产生喜忧参半的结果。数据偏向于最常发表的条件,导致会选取常规的反应参数而不是最佳条件。更糟糕的是,定量测量和应用的条件或技术的异质性使得无法区分报告的产率是实验失败还是难以分离的困境。试图使合成数据系统化的尝试正在出现,但仍处于初级阶段。
实时反应监测提供了一个关键优势:通过使用完整的动力学数据,可以训练预测模型。这些全面的数据解决了与数据完整性、偏离和过度简化相关的所有问题。首先,通过记录整个反应概况,可以捕获和解释不同研究人员操作时反应性能的差异。其次,它将捕获反应物的完整演变过程,允许目标材料和副产物及中间体的演变被描述。这些趋势将未来作为反应过程的有用源数据,因为它们捕获了可能的非研究重点的转化。总的来说,机器学习(ML)方法的模式非常适合训练出整个反应的复杂模式。
合成化学中的数据科学革命正在加速,增强了对丰富实验数据的需求。实时反应分析已经被利用来大大减少达到目标分子所需的时间。通过进一步将这些自动化数据收集方法与新的机器学习和人工智能工具相结合,我们预测最佳条件和发现新的合成路径的能力将呈指数级增长。
二、AI在化工制造流程中的应用
化工作为流程工业中的重要组成部分,其生产过程涉及大量的化学反应和物质转化,在工业运营中,AI已经可以用来帮助工程师和数据科学家执行日常任务。它们可以帮助使用自然语言或计算机语言,集成外部数据源,并与其他解决方案协同工作。例如:在化工企业的生产过程,经过操作数据进行训练生成的大模型方案,AI可能会根据现有信息提出行动方案建议,但最终决定权在工程师手中。
这里,AI通过自动执行日常任务将发挥更积极的作用。它遵循预定义的规则和程序,减少了人类对日常活动的干预。自动化智能常见于机器人流程,如在传送带上分拣材料或产品的机器。“
在另一个例子中,生成式AI可为创建机器学习模型或其他需要计算机语言的任务提供编码协助。它们还可以存储和检索信息,因此可以用作用例和相应的规范性信息的存储库,这些信息可以通过自然语言提示找到并提取。如果将生成式人工智能与其他技术结合使用,效果会更好。例如:利用检索增强生成技术(RAG),聊天机器人可以添加到这些数据库中。通过 API调用,工程师可以访问先进的工业分析软件并与其直接互动。他们可以简单地询问:“我上班后发生了什么?”启用 RAG 的 GPT 就会生成该时间段内事件的详细摘要。
不过,实施人工智能也会遇到一系列独特的挑战。最重要的是数据的质量和完整性。人工智能系统的有效性取决于其处理的数据。不准确或不完整的数据会导致错误的见解和决策。因此,必须重视为这些解决方案提供正确的数据。
化工流程制造业仍处于人工智能的试验阶段。各公司正在学习如何以及在哪些方面使这些解决方案的优势大于潜在风险。由于制造流程仍然需要工程师的决策技能,因此该行业正在谨慎行事。尽管如此,越来越多化工企业在尝试数智化转型,机器学习(ML)模型和仪表板的创建等实际应用也在不断涌现。
三、AI在化工过程中“异常检测”的应用
作为人工智能的一个应用案例,“异常检测“经常被提及。例如,业务专家可以对时间序列数据进行基准值的搜索,以发现预期模式的异常值。这些异常值会以易于理解的方式呈现出来,以便做出快速反应和决策从上下文数据中创建理想批次参数的独特标记,有助于定义异常情况并帮助检测异常情况。在更高级的情况下,应用自组织图(SOM)开发的模型能够在多元背景下发现全局和局部异常值。
在某特种化学品公司,工艺工程师们了解到使用此项技术进行异常检测的好处。通过先进的工业分析软件处理运行数据,数据科学家开发出了包括软传感器、异常检测评分和预测性维护警报在内的模型。
这些机器学习功能的集成使该公司在运营方面取得了重大改进。值得注意的是,该公司的批量处理时间减少了10%,相当于每天减少一批。此外,运营效率的提高还使能耗降低了9%。
结语:
人工智能正在稳步发展,技术进步日新月异。通过利用已有的大量数据,工程师们可以增加即时洞察力,从而优化运营。与此同时,企业正在采取许多必要的措施,以借助人工智能实现未来的成功。