本文发表在2025年的“中国科学院论文集”中发表的特殊主题:“生物制造 - 评论和展望”
Meng ,2,3 Cao Rui4 Hu Qin Lei1,2,3 Li ,2,3,5*
1 大学化学工程系
2教育部工业生物催化的主要实验室
3 大学合成与系统生物学中心
4新疆大学智能科学技术学院(未来技术学院)
5北京技术学院化学与化学工程学院生化工程研究所/工业和信息技术部关键实验室
绿色制造是一种现代制造模型,可全面考虑环境影响和资源益处,而绿色生物制造是绿色制造的重要方法之一,也是新优质生产力的重要组成部分。绿色的生物制造将细胞工厂作为核心,并利用可再生资源来实现低碳,绿色,可持续和有效的化学物质生产。其中,高性能细胞工厂的设计是实现有效绿色生物制造的首要任务。传统细胞工厂的设计过程是复杂且耗时的。随着人工智能领域的发展,数字辅助细胞工厂设计节省了时间和成本。通过组合数据库构建和更新等技术,代谢流量调节的数字设计,目标分子反向综合途径的数字设计,基因电路的数字设计,发酵过程的数字双胞胎以及其他技术,我们可以在整个生命周期中实现数字电池工厂的设计,指导整个生命周期,指导较高的构造和优化的小组型培训和优化绿色的绿色构造和。
绿色制造是一种现代制造模型,可全面考虑环境影响和资源益处。作为绿色制造的重要方法之一,绿色生物制造具有独特的优势。绿色的生物制造将生物细胞及其酶的反应过程作为核心,并使用二氧化碳,木质纤维素,作物废物,其他可再生生物基于生物的碳源作为原材料,以生产低碳和可持续产品,例如燃料,药物分子,材料,材料,体积化学物质和食物,以实现绿色和低级材料的生产和制造材料的生产和生产。绿色的生物制造可以有效利用资源和可持续的环境发展,并且是该国强大发展新优质生产力的提议的重要组成部分。绿色生物制造的特征是高科技,高性能,高质量等,完全符合新的生产力质量,并且是一种符合新开发概念的先进生产率质量。
图1细胞工厂生命周期的数字设计
作为绿色生物制造的核心,高性能的细胞工厂是工业发酵过程的主体。为了响应呼吁快速发展新质量生产力的呼吁,需要更新细胞工厂,并迅速迭代以适应不同的生产环境并追求更高的生产绩效,这为精确设计,快速迭代,生产过程控制了细胞工厂的发酵过程。随着计算领域的发展,“数字双胞胎”已经意识到化学过程优化和控制,新产品开发和测试等的数字化以及人工智能进一步扩大并改善了数字双胞胎的应用范围和效果。基于类似的想法,我们在细胞中数字构建复杂的生物学过程,构建多个数据库,并使用机器学习和其他方法来数字化酶,细胞工厂的代谢网络,发酵过程等,以形成细胞工厂整个生命周期的数字设计方法(图1)。使用这些方法,可以快速有效地获得高性能的细胞工厂,从而赋予绿色生物制造能力。
1。细胞工厂的数字化基础:代谢数据库,酶数据库
数据是数字化的基础。在细胞工厂中,酶催化的代谢反应是实现细胞生长和产物合成的关键。代谢数据库包含诸如代谢化合物,生化反应,催化生化反应的酶以及由代谢反应组合形成的代谢途径,这是代谢网络数字化的基础。
代谢数据库和酶数据库的当前开发状态
近年来,随着互联网时代的出现,酶和代谢数据的共享为研究人员带来了极大的便利(表1)。常用的综合代谢数据库,例如KEGG和(数据库子数据库)已经在分子水平上建立了对细胞代谢的系统理解,而PDB和其他酶反应数据库则集中在代谢反应酶的结构和功能上。代谢数据库和酶数据库的组合结合了由代谢途径组成的代谢网络与酶结构功能,催化活性,细胞定位等的酶催化数据的组合,形成了细胞工厂代谢的系统表征。同时,随着研究的加深,HMDB(人类代谢数据库),SGD(酵母基因组数据库)和GMD(植物代谢量数据库)等物种的专有代谢数据库和基因数据库也在特定应用环境中起重要作用。
表1主要代谢数据库和酶反应数据库
我的国家最近在开发和建立高质量的代谢和酶数据库方面发展了独立知识产权,从而在我国绿色生物制造业的发展安全性及其在国际社会中的核心竞争力造成了一定程度的隐藏危险。为此,近年来,该国和研究人员已开始关注生物科学数据的标准化和安全管理,并颁布了“中华人民共和国的生物安全法”。同时,依靠“中华人民共和国的数据安全法”和其他法律法规,我们将促进生物科学数据标准化数据库的构建和标准化管理。
基于大语言模型的数据库更新方法
随着合成生物技术的发展,细胞中新酶和代谢反应的更新速度呈指数增长。传统数据库的更新和维护需要手动分类信息,该信息具有一定的滞后。随着计算机技术的开发,可以通过文献中的机器学习提取代谢相关的信息。近年来,大语言模型(LLM)(例如GPT-4和BARD)在生物医学领域的开发和应用提高了提取生物代谢信息的速度和准确性。在一些文献中,代谢途径信息以图像格式显示。为了提取本文中未列出的代谢数据信息的这一部分,研究人员使用了机器学习模型,包括R-CNN和识别文献中包含代谢途径的图片,实现高通量和从文献中综合提取代谢反应信息。随着机器阅读文献中信息采集能力和准确性的提高,代谢数据库和酶数据库的数据更新将更加及时。
2细胞工厂的数字设计
酶是细胞中代谢反应的核心,酶的功能,活性和选择性直接影响细胞工厂的产物合成能力。酶的数字设计为细胞工厂的代谢反应提供了有效的催化剂。通过数字方法,可以预测蛋白质的结构和功能,并修改和设计酶,从而将酶的催化活性增加数百甚至数千次。例如,通过理论计算实验验证,ω-易丹胺酶的KCAT/KM值增加了1660倍。
蛋白质结构预测
蛋白质结构是其功能的基础,数字酶的设计取决于蛋白质结构的精确预测。 to , have a of , - on , -free , etc. on the deep , the team a deep to the , the of the , , and ions, the of 达到新的水平。
酶在细胞工厂中的转化 - 酶的重新设计
The of is on the of the , and the of the or key are , and the or are such as (QM), (MD), (CG) , , etc., and wet指导实验验证以实现快速酶设计,以改善催化活性或提高耐受性。
细胞工厂酶的创新 - 酶的设计
蛋白质结构决定了功能,从理论上讲,蛋白质的氨基酸序列决定了蛋白质结构。功能酶的大小比由随机氨基酸序列组成的“蛋白质空间”小得多。与酶的重新设计相比,酶的从头设计旨在结合现有的酶骨骼结构和功能特征,扩大蛋白质空间中已知的功能性酶的范围,实现新功能性酶的设计,并探索广阔的未知蛋白质空间。由于酶从头设计的难度,此阶段的高性能软件相对较少。各种软件等都可以实现酶的从头设计。其中,酶的从头设计是针对自然界中没有酶的化学反应进行的,例如消除反应,抗醛的凝结反应等,创建人工设计的酶,可以催化这些反应,从而促进这些反应,从而扩展了酶催化反应的类型,并促进了2024年的竞争,以促进其在2024年的促进,并在2024上进行了促进。蛋白质。
3细胞工厂代谢网络的数字设计
酶的数字化已实现了酶催化的代谢反应和新功能酶的设计的优化,并以酶催化的反应为核心扩大了细胞工厂的功能。在细胞工厂的代谢水平上,内源性酶促反应将形成一个复杂的代谢网络,并且通过合成生物学添加的外源性途径增加了细胞工厂设计的难度。为了实现目标产物的有效合成,在细胞工厂中,有必要在复杂的代谢网络中优化材料流,能流,异源合成路径等的组织,这通常需要大量的材料和时间成本。基因组规模代谢网络模型(GEM),生物反向合成途径预测和数字化基因电路设计等数字方法可以指导细胞工厂的设计并降低试验和错误成本(图2)。
图2细胞工厂代谢网络的数字设计
基因组规模的代谢网络模型(GEM)指导细胞工厂代谢网络的数字设计
GEM将代谢网络数字化,以描述生物体整个代谢途径中基因 - 蛋白质代谢反应的关系特征。这是一种系统的生物学研究方法,可通过数学模型模拟细胞内代谢反应。由于研究人员已经在接下来的20年中首次完成了宝石在血友中的构建和应用,以提高GEM计算的准确性,基于代谢流量平衡分析(FBA)的基本算法(FBA)与代谢流矩阵作为核心的其他约束,诸如的核心构成,构成的其他级别,,, , , , , , , 和有了实验数据,例如转录组学和代谢组学,已经实现了各种生物高质量宝石的构建和应用。随着获得实验数据的成本降低并加速了数据更新速度,GEM也在不断更新和重构以适应不同的应用程序环境。
GEM的模型构建方法主要包括:手动构造,自动构造和半自动结构。该工具箱在2010年的开发实现了手动宝石构建的数字化,但手动构造花了很多时间。自动和半自动工具加速了宝石型号的构建,并自动构造宝石。诸如种子之类的工具箱可以迅速产生大量物种的宝石,但是数据质量极大地影响了自动构造的宝石模型的准确性。半自动的宝石构建工具不仅可以快速收集数据,还可以执行手动数据校正,确保快速构造模型的准确性,并成为此阶段GEM构建和重建的主要方法。在此阶段,半自动模型构建的方法已经逐渐成熟,并且正在成为标准化。已经开发和使用了各种工具箱:工具可以重建和分析GEM [36]并可视化结果;它们集成了序列匹配和亚细胞定位功能,使其非常方便使用。工具通过动态和分子生物学数据将酶限制因子添加到GEM中,从而提高了GEM预测能力。
使用构造的模型,通过FBA算法计算细胞内代谢流,并且预测细胞旨在最大化产物生长或产生产物的代谢通量,从而为了解细胞代谢流的变化提供了帮助。尽管MOMA和其他算法旨在改善生长和生产,预测细胞代谢通量的分布,并提供基因表达强度优化策略,以为细胞工厂的实验设计提供指导。
随着数据更新速度的加速和模型构建技术的更新,研究人员意识到了各种工业微生物宝石的重建和迭代,并使用这些宝石实现了工业细胞工厂代谢网络的数字设计(表2)。
表2广泛使用工业微生物的常见底盘宝石信息
合成工具有助于细胞工厂异源途径设计
在建造一个细胞工厂的过程中,在该工厂中,新的化合物或从未在细胞工厂合成的化合物,需要大量时间和精力来分析和设计未知的途径,并且此过程强烈依赖于专家知识。通过生物学反向综合策略,与数据库中的数据信息,数字电池工厂靶向分子以及通过反应规则,机器学习和其他方法相结合,它们使用酶的异质性来扩展酶催化反应,然后反复地分析目标分子的复杂结构,并将其用于内构的综合构造,以远离工厂的综合构造,以实现工厂的综合综合性,以实现工厂的综合性。细胞工厂的外源代谢途径。反向综合设计结合了从头设计和上述章节中引入的酶的重新设计,以及细胞工厂代谢网络的数字设计,形成了目标分子细胞工厂代谢途径的完整设计。
在目标分子的异源合成途径的设计中,生物反向合成,可以根据原理和实施难度将其分为两类:
1。基于已知酶和代谢反应的知识基础搜索方法;
2。根据反应规则提取或机器学习预测未知的新酶促反应的方法。
可以将这两种方法组合在一起以实现反向合成路径设计,这更符合实验设计思想。
基于知识库搜索的途径设计方法不能超过数据库中的数据,并且受已知酶促反应的数据量表的限制。通过诸如蒙特卡洛树搜索(MCT),无环路搜索和其他软件等算法,以实现基于已知酶促反应的反向合成途径的设计。成功发现了具有较高碳利用和能源利用率的新方法,并应用于细胞工厂的结构。
在预测新的酶代谢反应方面,扩展新酶促反应的方法可以分为:基于反应规则,无模板反向合成设计方法和半情节板反向合成设计方法的反合成设计方法。
基于反应规则的逆综合设计通过原子原子映射和其他方法从已知数据库中提取反应规则,并使用标准化方法来形成反应规则数据库。例如,ni等。提取并简化了包含数据库中1224个反应规则的规则数据库;简约反应规则数据库,其中包含该软件使用的99个反应规则;并通过.0,RL等算法(例如MCT)构建了反向合成途径设计软件。
无模板逆合合成设计方法使用反应数据库来训练机器学习模型,将“反应剂 - 产品信息对”视为翻译过程,并使用自然语言处理(NLP)来构建模型以实现逆综合反应途径的扩展。基于此方法,已经开发了基于酶EC数字的算法或软件,例如-NP和预测模型。
在基于反应规则的逆综合设计结果中,反应数据库反应规则数据库之间的映射关系可以为预测途径提供酶参考信息,并且可以根据现有信息进行酶的数字设计,但是设计路径受到反应规则数据库的限制。无模板的反向合成设计方法通过机器学习大大扩展了酶促反应空间,但是由于酶促反应数据的量仍然很小,但仍需要提高其准确性。基于深度学习开发的半模板逆综合设计软件,例如通过分子图捕获分子结构特征,它解决了现有公式在无模板方法中是唯一输入的问题,因此模型无法理解分子结构信息。半主板方法通过预测反应中心来提高模型的可解释性,并确保通过深度学习的膨胀能力和逆综合预测的多样性。
基因电路的数字设计调节基因时序表达
为了满足细胞工厂中基因表达的时间序列调节的需求和不同代谢模块之间的代谢通量调节,必须设计逻辑栅极基因线,例如基因逻辑,时机,定量表达调节和同时表达多个基因的表达调节。完成这些设计需要使用转录调节工具,例如诱导启动子,基于特定DNA序列靶向蛋白的启动子抑制和转录因子。面对复杂的问题,例如多个基因的逻辑构造,手动设计的昂贵且精度较低,而遗传电路自动化设计(GDA)可以快速组装并设计标准化的基因组件到具有所需功能的基因回路中。
GDA基于标准化的组件库,以实现基因电路的数字设计。研究人员使用诸如合成生物学开放语言(SBOL)和系统生物学标记语言(SBML)等方法来构建标准化的基因元素数据库,例如IGEM。基于这些数据库,已经开发了诸如和和,诸如GDA软件,以实现基因电路的快速而准确的数字设计。其中,该软件的基因电路设计已被广泛用于细胞工厂,例如大肠杆菌,酵母,杀菌性多形。
4单元工厂的发酵过程和过程数字化
在获得高性能的单元厂后,为了使其能够实现工业规模的发酵和目标产品的生产,需要逐步扩大发酵系统,以优化发酵过程和过程参数以实现有效的产品生产。面临一系列问题,例如复杂的生物发酵系统,缺乏有效的传感器,低样本测量频率以及及时性差,数字双胞胎以及对工业级发酵过程的优化控制有助于改善发酵系统和产量的控制(图3)。
图3单元工厂的发酵过程和过程数字化
发酵系统的放大和数字化发酵过程控制
在发酵过程的设计过程中,放大效果的存在导致过程设计与实际的工业生产环境不相容,从而影响了细胞工厂的合成效率。通过数字双胞胎和数字手段,例如与知识图结合,可以实时对发酵过程进行数字模拟和监控,并且可以自动化发酵过程以实现发酵过程的优化。
在发酵过程中,数字双胞胎通过接收由发酵过程产生的实时数据(例如溶解氧(DO),排气气分析,温度等,并优化并根据发酵态对发酵系统做出决策,来分析发酵态。通过人工智能并与实际的发酵系统结合使用,可以实现飞行员级别和生产级发酵系统的数字双胞胎模型构建,并且可以改善产品输出。根据关键因素与数字双胞胎之间的关系结合知识图方法,以构建两种方法的集成决策模型可以提高预测准确性并增强控制性能。
发酵研讨会数字管理系统的设计
在工业生产中,设备,原材料,人力资源等资源的时间和空调也是确保发酵过程和工业生产效率的重要因素。在“行业4.0”的概念下,工业生产过程得到了信息,构建了企业资源计划(ERP)系统,制造执行系统(MES)与自动化系统结合使用,以实现实时数据收集和管理,以及对资源和设备的安排进行了安排,并进行了构建的数字效率,并提高了构建的数字效率,并改善了成本,并改善了改进的成本。
5数字小组工厂摘要和前景
基于人工智能,模型构建等的数字方法已在整个细胞工厂构造过程中广泛使用。与传统的单元工厂设计方法相比,数字设计具有高效和节省成本等优点。在以细胞工厂为核心的绿色生物制造的快速开发的背景下,细胞工厂设计的数字化过程正在不断加速,形成了细胞工厂的数字设计,包括数据库构造,包括细胞工厂代谢设计,发酵系统设计,发酵过程法规等(图1)。随着未来计算能力的提高和更深入的学科的交集,整个生命周期中数字牢房工厂的设计将朝着更准确,更快,更有效,更加完整的过程的方向发展,从而赋予绿色生物制造能力。
Meng 是大学化学工程系的博士生。主要研究领域:合成生物学,微生物细胞工厂,数字细胞工厂。
大学化学工程系校长,李轮教育部,教育部工业生物催化局的主要实验室主任,大学。主要研究领域:天然产物的微生物合成和生物转化,抗压力的分子设计和工程应用,工业微生物,生物催化和酶工程的应用。
文章起源于:Meng ,Cao Rui,Hu Bing等。细胞工厂设计的数字化赋予绿色生物制造。中国科学院论文集,2025,40(1):67-78。
doi:10./j.issn.1000-3045 ..
版权声明:本文为 “博览广文网” 原创文章,转载请附上原文出处链接及本声明;
工作时间:8:00-18:00
客服电话
0755-88186625
电子邮件
admin@lanyu.com
扫码二维码
获取最新动态