摘要:● 2024年12月15日,农业农村部食物与营养发展研究所任广旭,王加启、清华大学何亮和中国农业科学院深圳农业基因组所刘永鑫等在iMeta在线发表了题为“
长期摄入乳脂不会显著增加正常和高脂饮食小鼠的血脂负担
iMeta主页:http://www.imeta.science
研究论文
● 原文: iMeta (IF 23.8)
●
原文链接DOI: https://doi.org/10.1002/imt2.256
● 2024年12月15日,农业农村部食物与营养发展研究所任广旭,王加启、清华大学何亮和中国农业科学院深圳农业基因组所刘永鑫等在iMeta在线发表了题为“
The long-term intake of milk fat does not significantly increase the blood lipid burden in normal and high-fat diet-fed mice
”的文章。● 本研究使用高脂饮食模型,结合乳脂肪、全奶以及自然膳食组的粪便肠道微生物及代谢物数据,系统评估了长期摄入牛奶脂肪对于宿主血脂指标的影响,通过堆叠交叉验证(CV)和SHAP(Shapley Additive exPlanations)优化的机器学习模型能够基于宿主粪便微生物及代谢物准确预测宿主外周血LDL-C及HDL-C的变化情况。本研究为制定膳食政策及早期血脂评估和个性化营养策略提供了重要参考。
● 第一作者:任广旭、何亮、刘永鑫
● 通讯作者:王加启(wangjiaqi@caas.cn)
● 合作作者:费予珂、刘小凡、陆秋佚、陈欣、宋志达
● 主要单位:农业农村部食物与营养发展研究所、清华大学电子工程系、中国农业科学院深圳农业基因组研究所、新疆大学计算机科学与技术学院以及中国农业科学院北京畜牧兽医研究所
亮 点
● 对正常饮食和高脂饮食(肥胖)小鼠长期摄入牛奶脂肪并没有显著增加宿主血脂负担;
● 牛奶脂肪诱导的特定差异微生物和代谢物参与调节低密度脂蛋白胆固醇(LDL-C)和高密度脂蛋白胆固醇(HDL-C)水平;
● 利用优化的机器学习算法能够基于宿主粪便肠道微生物及代谢物准确预测小鼠外周血LDL-C和HDL-C变化。
摘 要
牛奶是全球消费最广泛的食品之一,其对正常和肥胖人群血脂的长期影响仍然存在争议。我们使用控制饮食的C57BL/6J小鼠,研究了长期摄入牛奶脂肪和全脂牛奶对正常饮食(ND)和肥胖饮食(HFD)小鼠血脂的影响。将牛奶脂肪和全奶连续干预ND和HFD小鼠七周(大约相当于人类5-6年),均并未显著提高小鼠外周血低密度脂蛋白胆固醇(LDL-C)水平。值得注意的是,ND小鼠在牛奶脂肪干预后,其附睾白色脂肪(ppBlautia、Romboutsia和Prevotellaceae_NK3B31)与宿主外周血LDL-C和高密度脂蛋白胆固醇(HDL-C)水平显著相关。非靶向代谢组学识别出338种与LDL-C负相关的肠道代谢物(R p 0.5,p
视频解读
Bilibili:https://www.bilibili.com/video/BV1BCBKYHEXt/
Youtube:https://youtu.be/1SyzZ6IKn3g
中文翻译、PPT、中/英文视频解读等扩展资料下载
请访问期刊官网:http://www.imeta.science/
全文解读
引 言
全球有超过60亿人摄入牛奶,使其成为全球最重要的食物来源之一。前期观察性研究表明,富含饱和脂肪酸(FA)的食物与心血管疾病(CVD)风险增加呈正相关。全脂牛奶富含乳脂肪,通常被认为会导致肥胖和心血管疾病。因此,乳脂肪被认为会像膳食脂肪一样增加宿主的血脂负担。早前流行病学研究提示摄入全脂牛奶与冠心病风险增加相关,因此一些国家饮食指南也建议减少乳脂肪的摄入,以预防心血管疾病。然而,以往研究均未考虑脂肪的来源和种类的综合作用。随着研究的深入,越来越多的研究表明,乳脂肪中含有许多对人类健康有益的成分,如单不饱和脂肪酸、多不饱和脂肪酸、ω-3脂肪酸和中链饱和脂肪酸。一项来自21个国家、跨五大洲的大型跨国队列研究结果表明,乳制品的摄入与低死亡率和低主要心血管事件发生风险相关。而且,越来越多的证据表明,增加乳脂的摄入并不会增加心血管疾病的发生风险,甚至可能降低中央肥胖风险。因此,长期摄入乳脂肪与宿主血脂代谢之间的关系仍然存在争议。这些矛盾结论的出现,主要是由于人类复杂的遗传背景、不准确的饮食监测以及研究条件差异等因素共同作用的结果。
值得注意的是乳脂肪和全脂牛奶都含有潜在的有益成分,其所蕴含的多种有益成分的叠加可能对健康结果产生影响。比如,这些有益成分可以重塑宿主的肠道微环境,从而对整个肠道代谢物的分泌网络产生一定影响。肠道微生物群已被证明与肥胖和代谢相关。研究表明肠道菌群和代谢物是循环脂质水平的重要驱动因素。因此,本研究主要是想回答长期摄入乳脂是否会增加正常和肥胖宿主的血脂负担,以及肠道微环境是否在此过程中发挥作用。
本研究利用了基因特征明确的高脂饮食模型小鼠,评估了长期摄入乳脂和全脂牛奶对正常饮食(ND)和高脂饮食(HFD)小鼠血脂水平的影响。我们的研究结果表明,长期摄入乳脂肪和全脂牛奶不会显著增加正常和高脂饮食导致的肥胖宿主的血脂负担,反而改善了肠道微生物群结构。乳脂肪和全脂牛奶通过调节肠道关键细菌和代谢物,双向调节低密度脂蛋白胆固醇(LDL-C)和高密度脂蛋白胆固醇(HDL-C)水平。通过优化的机器学习算法分析肠道变化,使我们能够准确预测宿主的血脂动态。
结果和讨论
长期乳脂肪摄入对正常小鼠和高脂饮食小鼠血脂水平的影响
为了评估长期摄入乳脂和全脂牛奶对正常饮食和高脂饮食小鼠血脂水平的影响,我们给C57BL/6J小鼠提供连续10周的高脂饮食来诱导宿主高脂血症,结果导致HFD小鼠体重增加并伴随外周血LDL-C升高和HDL-C降低(图1A和S1A-D)。在为期7周的牛奶脂肪和全奶等干预期间,无论是在正常饮食(ND)小鼠还是高脂饮食(HFD)小鼠中,乳脂肪、全脂牛奶及其他成分都没有导致体重增加。尽管ND小鼠摄入全脂牛奶后,每周的食物摄入量显著降低(p pp
乳脂肪通过靶向关键肠道细菌双向调节外周血LDL-C和HDL-C的含量
由于肠道微生物群影响宿主代谢并受饮食调控,我们接下来研究了乳脂肪和全脂牛奶如何影响宿主肠道微生物群网络。正如预期的那样,高脂饮食显著减少了宿主肠道微生物扩增子序列变体(ASVs)和多样性(图1E和S2A,B)。有意思的是在正常饮食(ND)小鼠中长期摄入乳脂肪和全脂牛奶能显著提高肠道微生物中的α多样性,但是却对高脂饮食(HFD)小鼠的ASVs、OTUs和α多样性几乎没有改善效果。这表明高脂饮食对肠道微生物的影响更强(图1E和S2A,B)。接下来,我们以累积贡献率大于70%作为主成分阈值。根据这一标准,主成分分析结果(图1F) PC1可以解释45.69%的总方差,PC2可以解释30.87%的总方差。这些数据表明,ND和HFD条件下肠道微生物群的结构显著不同(图1F和S2D)。HFD小鼠表现出Desulfovibrio和Ruminiclostridium相对丰度的增加,以及Alloprevotella相对丰度的减少(图S2C)。虽然乳脂肪和全脂牛奶显著改变了ND小鼠的微生物结构(图1F),但它们却未能逆转HFD诱导的肠道变化。相关性分析显示,ASVs、OTUs、Shannon和Observed_species与LDL-C、总胆固醇和甘油三酯呈现负相关,而与HDL-C呈现显著正相关(图S2E)。
我们对185种肠道微生物属与脂质指标的斯皮尔曼相关分析,结果发现宿主肠道中Blautia、Akkermansia、Bacteroides和Tyzzerella与LDL-C呈负相关,而Blautia、Lactococcus和Desulfovibrio与HDL-C呈显著正相关(图1G,H)。我们还分析了属水平的菌株与总胆固醇和甘油三酯水平之间的相关性(图S2 F,G)。进一步分析发现乳脂肪组中有11种独特细菌,包括Blautia、Bacteroides和Akkermansia,这些细菌与血脂水平显著相关(图1I)。其中,Blautia、Prevotellaceae_NK3B31_group和Romboutsia已知能够双向调节LDL-C和HDL-C,促进健康的脂质水平。这些发现表明,与其他饮食脂肪不同,长期摄入乳脂肪能重塑肠道微生物群,双向调节LDL-C和HDL-C,并且不会增加宿主的血脂负担。
图1. 长期摄入乳脂肪和全脂牛奶对正常饮食或高脂饮食小鼠血脂水平和肠道微生物群的影响
(A)在一周的适应期中,8周龄SPF雄性C57BL/6J小鼠被喂以标准啮齿动物饲料和自由饮水。随后,它们被随机分配到正常饮食(ND)组或高脂饮食(HFD)组,持续10周,在此期间测量小鼠血脂指标,包括低密度脂蛋白胆固醇(LDL-C)和高密度脂蛋白胆固醇(HDL-C)。随后,小鼠被分为六个亚组(n = 10)进行为期7周的干预:ND对照组(N-Ctl)、ND全脂牛奶组(N-Mlk)、ND乳脂肪组(N-Fat)、HFD对照组(H-Ctl)、HFD全脂牛奶组(H-Mlk)和HFD乳脂组(H-Fat)。还包括乳清蛋白(Whp)、酪蛋白(Cas)和乳铁蛋白(Ltf)等其他成分,详细信息见补充材料。实验结束后分析体重、血脂水平、脂肪组织、肠道微生物群和粪便代谢物。这些数据将用于训练和验证机器学习算法。在ND和HFD小鼠进行7周乳脂肪和全脂牛奶干预后,评估体重变化(B)、LDL-C(C)、HDL-C(D)和肠道微生物群ASVs变化(E)。多个组之间的比较使用单因素方差分析(One-way ANOVA)。*、**、***和****分别表示pppp10(p值))表示。(I)维恩图显示乳脂干预后与血脂指标相关的独特属水平功能性细菌,饼图展示了与LDL-C调节相关的功能性见解,研究文献通过PMID编号引用。乳脂肪影响肠道代谢物谱,差异代谢物调节宿主血脂代谢
鉴于肠道微生物主要是通过其分泌的代谢物调节宿主健康,为此我们进行了非靶向代谢组学分析,以阐明代谢物对宿主血脂水平的影响。在对1177种代谢物的分析中,ND小鼠中的全脂牛奶上调了9种代谢物,下调了13种,而乳脂肪上调了5种,下调了3种(图2A)。在HFD小鼠中,全脂牛奶影响了7种代谢物,而乳脂的影响更为显著,上调了49种,下调了75种。这些结果表明,乳脂在HFD小鼠中比在正常小鼠中更有效地重塑肠道代谢组。为了阐明肠道代谢物与LDL-C和HDL-C水平之间的关系,我们进行了相关性分析,以绝对相关系数大于0.5作为显著性阈值(图2B)。值得注意的是,338种代谢物与LDL-C呈负相关,129种呈正相关;对于HDL-C,有20种代谢物与其呈负相关,11种呈正相关。此外,Beta-Estradiol(β-雌二醇)和Savinin(桧脂素)与Chao1和总胆固醇呈显著正相关,而Rosmarinine(迷迭香碱)和L-Cysteine-S-sulfate(L-半胱氨酸-S-硫酸盐)与其呈显著负相关(图S3A,B)。 我们还发现3-甲基腺嘌呤与甘油三酯呈显著负相关(图S3C)。
进一步分析发现,HFD导致280种特定的差异代谢物,而乳脂肪诱导了19种特定的差异代谢物(图2C)。这些乳脂肪诱导的19种差异代谢物主要由脂肪酸、酚类及其衍生物组成。对各组差异代谢物的功能分析表明,来自全脂牛奶和乳脂干预的代谢物,如Cis-5,8,11,14,17-Eicosapentaenoic acid(顺式-5,8,11,14,17-二十烯五烯酸)、Beta-Estradiol(β-雌二醇)、Adrenosterone(肾上腺甾酮)、Tyrosine(酪氨酸)、Progesterone(孕酮)等,参与了Taurine(牛磺酸)和Hypotaurine(亚牛磺酸)代谢、Steroid hormone(类固醇激素)和生物合成、氨基酸代谢、亚油酸代谢和不饱和脂肪酸的生物合成(图S3D)。在这19种差异代谢物中,11(E)-Eicosenoic acid(11 (E)-二十碳烯酸)和Trans-Cinnamic acid(tCA,反式肉桂酸)能够降低LDL-C,其中tCA还降低了Adiponectin(脂联素)。Homovanillic acid(香草酸)增加了HDL-C,并与代谢相关脂肪肝病(MAFLD)的风险降低相关。Biliverdin(胆绿素)减少了总胆固醇,而Heptadecanoic acid(十七烷酸)与心血管代谢疾病和肝脏脂肪呈负相关。3,4,5-Trimethoxybenzoic acid(3,4,5-三甲氧基苯甲酸)则增强了抗氧化能力(图2D)。
使用优化的机器学习算法预测肠道微生物群及代谢物重塑对血脂变化的影响
为揭示驱动血脂变化的因素及其与乳脂肪和全脂牛奶的摄入关系,我们应用了优化的机器学习算法来预测血脂水平(图2E),发现体重对LDL-C和HDL-C预测有显著影响。此外,Trans-Cinnamic acid(反式肉桂酸)、11(E)-Eicosenoic acid(11(E)-二十碳烯酸)和Fraxin(秦皮苷)是预测LDL-C的关键因素,而4-Methyl-5-thiazoleethanol(4-甲基-5-羟乙基噻唑)、Anaerofustis(厌氧棒形菌属)和Zizybeoside(无刺枣苄甙)对HDL-C的预测有较强影响(图2F)。令人鼓舞的是,我们的算法使用肠道数据准确预测了LDL-C(R² = 0.96)、HDL-C(R² = 0.89)、甘油三酯(R² = 0.79)和总胆固醇(R² = 0.96)(图2G,H和S4C,D)。三元图显示,乳脂肪和全脂牛奶显著影响HDL-C和LDL-C预测结果的关键因素(图S4A,B)。这些发现表明,用于准确预测LDL-C和HDL-C变化的因素之间存在复杂调控网络,表明乳脂肪对血脂的影响是广泛的。肠道因素相互关联共同影响了血脂水平(图2I,J)。个体核心因素及其网络共同影响HDL-C和LDL-C的结果。
尽管在为期7周的干预期间,ND和HFD小鼠的体重和LDL-C水平之间没有显著差异(p> 0.05),但与对照组相比,N-Mlk、N-Fat、H-Mlk和H-Fat组的小鼠体重和LDL-C平均值略有增加(图1B,C)。乳脂由多种脂肪酸组成,包括Saturated fats(饱和脂肪)、Conjugated linoleic acid(CLA,共轭亚油酸)和Trans-vaccenic acid(反式疫苗酸),每种成分对脂肪积累和LDL-C含量的影响不同。例如,CLA可能减少肥胖,而Trans-vaccenic acid(反式疫苗酸)则降低LDL-C和甘油三酯。我们的研究表明,乳脂肪和全脂牛奶可能通过改善复杂的调控网络,而非单一微生物菌株或代谢物发挥作用。这解释了为什么即使经过七周(大约相当于人类5-6年),也没有观察到体重或LDL-C的显著差异。值得注意的是本研究使用了ND和HFD小鼠模型。我们知道小鼠具有两种亚型的载脂蛋白,APOB48和APOB100,使得它们天然具有抗动脉粥样硬化的能力。因此,未来研究乳脂对动脉粥样硬化的影响时,建议考虑使用LDLR-/-、APOE-/-小鼠模型或仓鼠模型,这些模型更能模拟人类的脂质代谢。这些研究还应包括肝脏和脂肪组织形态的详细分析,以提供对潜在机制的更深入见解。图2. 乳脂肪和全脂牛奶塑造肠道代谢组,并通过肠道微生物群和粪便代谢物数据实现基于机器学习的宿主血脂水平预测
(A)火山图显示ND和HFD小鼠在经过7周乳脂肪和全脂牛奶干预后的差异肠道代谢物。橙色和深红色点代表绝对Log2(变化值)> 1.5的代谢物。Y轴上的虚线表示-log10(q值)= 1.5。(B)肠道代谢物与血脂水平(LDL-C和HDL-C)之间的斯皮尔曼相关分析,结果以渐变色(-log10(p值))表示。X轴表示斯皮尔曼秩相关系数,Y轴按相关强度排列3,237种代谢物。对于HDL-C,有20种代谢物与其显著负相关(Sig_Neg),11种与其显著正相关(Sig_Pos)。对于LDL-C,有338种代谢物与其显著负相关(Sig_Neg),129种与其显著正相关(Sig_Pos)。(C)乳脂肪和高脂饮食诱导的独特代谢物的分类和比例。HFD诱导了280种独特代谢物,乳脂诱导了19种独特代谢物。代谢物类别以不同颜色显示。维恩图突出显示HFD组(H_Ctl)和乳脂组(N_Fat)之间共享和独特的代谢物。(D)乳脂肪独特诱导的关键差异代谢物,已被报道与脂质代谢相关及其功能关系。(E)使用肠道代谢物和微生物结构训练机器学习模型以预测血脂水平的示意图。(F)Shapley加性解释(SHAP)分析识别了影响LDL-C和HDL-C预测准确性的20个关键因素。(G,H)基于肠道微生物群和粪便代谢物数据的血脂水平机器学习预测,蓝线表示预测值,红线表示实际值。(I)和(J)Taxi网络图主要呈现预测LDL-C(I)和HDL-C(J)水平的主要贡献代谢物之间的相关网络,以及它们与血脂指标(LDL-C和HDL-C,网络图中的黑点)之间的相关性。红线表示正相关,蓝线表示负相关,线条的粗细表示相关性强度。红点代表高丰度值,蓝点代表低丰度值,灰点表示无丰度值。结 论
我们的研究表明,长期摄入乳脂肪和全脂牛奶不会显著增加正常或肥胖小鼠的血脂负担。与其他饮食脂肪不同,乳脂有助于改善肠道微生物群的多样性,并增加参与脂质调节的关键细菌和代谢物的丰度。通过优化的机器学习算法,我们绘制了一个独特的肠道-代谢物网络,能够通过宿主的肠道微生物群和代谢物谱准确预测血脂指标的变化。这些发现加深了我们对乳脂长期影响脂质健康的理解,并为全球营养政策的发展提供了数据支持。
方 法
研究模型
本研究使用了来自北京维通利华实验动物技术有限公司8周龄无特定病原体(SPF)雄性C57BL/6J小鼠。小鼠到达后被安置在北京理工大学,维持12小时光照:12小时黑暗的周期,并调节湿度和温度。所有涉及动物的实验程序均根据农业农村部食物与营养发展研究所实验动物伦理委员会(IACUC)批准的方案进行,批准号为YYSLLSC2020005。
实验设计
在为期一周的适应性喂养期间,小鼠被喂以啮齿动物标准维持饲料,并提供自由饮水。适应性喂养并收集基线数据后,小鼠被随机分配到两组:正常饮食组(ND)和高脂饮食组(HFD),并持续喂养10周,同时监测血脂指标。完成高脂血症模型后,小鼠随后被分为六个亚组(n=10),进行为期7周的干预:ND对照组(N-Ctl)、ND全脂牛奶组(N-Mlk)、ND乳脂组(N-Fat)、HFD对照组(H-Ctl)、HFD全脂牛奶组(H-Mlk)和HFD乳脂组(H-Fat)。还包括乳清蛋白(N-Whp和H-Whp)、酪蛋白(N-Cas和H-Cas)和乳铁蛋白(N-Ltf和H-Ltf)等附加成分。在牺牲时点,分析体重、血脂水平、脂肪组织、肠道微生物群和粪便代谢物(图1A)。
正常饮食、高脂饮食和乳制品相关成分
正常饮食(ND)使用北京科澳协力饲料有限公司提供的标准SPF级维持饲料(MCF,GB14924.3-2010,CNS),高脂饮食(HFD)使用来自Research Diets 公司的高脂饲料(HFC,D12492)。HFC(5.24 kcal/g)含60% 脂肪、20% 碳水化合物和20%蛋白质,而MCF含11.4% 脂肪、62.8% 碳水化合物、25.8%蛋白质。小鼠最初喂MCF自由摄入以适应。接下来的十周中,正常饮食(ND)和高脂饮食(HFD)组分别给予不限量的MCF和HFC。对于七周的干预,全脂牛奶亚组小鼠每天给予15毫升巴氏消毒牛奶(每100克含脂肪3.7克、蛋白质3.1克、碳水化合物4.7克、能量270KJ);乳脂肪亚组通过胃管每天给予0.5毫升乳脂(每100克含脂肪40克、蛋白质1克、碳水化合物4克、能量1565KJ);乳清蛋白(Yuanye BiotechR,> 80%纯度)以54 mg/mL的浓度灌胃;乳铁蛋白(> 95%纯度)以33mg/mL的浓度灌胃;酪蛋白(> 90%纯度)以48mg/mL的浓度灌胃喂养。血脂测量
在禁食8小时后,从小鼠采集静脉血样进行血脂生化分析。分离外周血并静置后,通过离心获得血清。使用奥林巴斯 (OLYMPUS)AU-2700全自动生化分析仪(Olympus AU2700; Olympus, Hamburg, Germany)分析并测量血清中的低密度脂蛋白胆固醇(LDL-C)、高密度脂蛋白胆固醇(HDL-C)、甘油三酯(TG)和总胆固醇(TC)水平。
16S rRNA微生物组测序
干预结束后,提取粪便DNA并对16S rRNA基因的V3-V4区域进行测序,使用MiSeq平台(Illumina),按照之前发布的方法进行。使用E.Z.N.A. Stool DNA Kit(Omega Bio-tek, Norcross, GA, US)根据制造商的说明提取解冻后的粪便样品中的DNA。通过2%琼脂糖凝胶电泳和分光光度法评估DNA的质量。使用FastPfu DNA聚合酶(TransStartTM,TransGen Biotech)扩增16S rRNA基因的V3-V4区域,使用以下引物:336F,5’-GTACTCCTACGGGAGGCAGCA-3’;806R,5’-GTGGACTACHVGGGTWTCTAAT-3’。PCR循环条件如下:95℃加热5分钟;然后进行28个循环,每个循环95 ℃ 45秒、55 ℃ 50秒、72 ℃ 45秒;最后72 ℃ 延伸10分钟。纯化的扩增子按等摩尔量混合并进行双端测序(2×300),使用Illumina MiSeq平台根据标准协议进行。将序列数据编译并进行质量过滤。通过UCLUST使用97%的相似度阈值将唯一序列集分类为操作性分类单元(OTUs)。通过Usearch(版本8.0.1623)识别并去除嵌合序列。通过UCLUST与Silva 119 16S rRNA数据库比对,并以90%的置信度阈值对每个16S rRNA基因序列的分类进行分析。通过GLSEARCH程序根据相似性为每个OTU分配分类。使用Faith的系统发育多样性计算α多样性值。
代谢组分析
粪便代谢物通过超高效液相色谱(UPLC)系统分析,使用来自Agilent Technologies(美国加利福尼亚州圣克拉拉)1290 Infinity LC型号,与AB Sciex(美国马萨诸塞州弗雷明汉)的四极飞行时间质谱仪TripleTOF 6600相连。粪便样本分析使用的是Waters(美国马萨诸塞州米尔福德)生产的2.1 mm × 100 mm ACQUIY UPLC BEH色谱柱,颗粒尺寸为1.7 μm。流动相与正负电喷雾电离模式兼容,分别由25 mM醋酸铵和25 mM氢氧化铵溶液(分别溶于水和乙腈)组成。溶剂梯度从第一分钟85%乙腈开始,在接下来的11分钟内线性减少至65%,然后在0.1分钟内进一步减少至40%,保持4分钟,之后在另0.1分钟内恢复至85%,并进行5分钟的再平衡阶段。电喷雾条件经过优化,离子源气体Gas1和Gas2设定为60,幕气设为30,源温度设为600°C,喷雾电压浮动在±5500 V。质谱仪配置为捕获m/z信号范围为60至1000 Da,每个谱图的飞行时间MS扫描积累时间为0.20秒。在auto-MS/MS模式下,m/z范围设定为25至1000 Da,每个谱图的产物扫描积累时间为0.05秒。信息依赖采集模式在高灵敏度模式下进行产物扫描,碰撞能量固定为35 ± 15 eV,去聚集电势为 ± 60 V。
质量控制样本
通过将研究中所有生物样本的等分样品混合来创建池样/组内质量控制样本。代谢物鉴定通过高精度质谱(质量误差p值),识别组间具有显著差异的代谢物。代谢物的显著性由VIP值>1.0、p值
机器学习算法
数据以9:1的比例分为训练集和测试集,并通过20次迭代来开发模型,涉及模型和特征选择过程。autoML框架从多种算法中选择模型并提取特征,采用置换重要性方法识别对预测最有影响的特征。这些特征用于在后续迭代中优化模型,模型性能通过测试集上的R²得分进行监控。最终模型,通过20次迭代获得最高R²得分,展示了用于预测血脂的机器学习工作流程,如图2所示。
详细材料和方法如下:
总体过程
我们将原始数据按9:1比例分割为训练集和测试集。模型构建过程在20次迭代中完成,每次迭代包括两个部分:模型选择和特征选择。这两个部分共同作用于识别数据中具有高生物学可解释性的特征。首先,从数据中提取所有特征,并使用autoML框架从多个机器学习算法中获得训练模型。然后,采用置换重要性方法选择对预测结果影响最大的特征,并使用这些特征进行下一次迭代的模型训练。训练模型的性能在测试数据集上进行测试,并记录其R²得分。经过20次迭代,我们获得了具有最高R²得分的模型。预测血脂的机器学习工作流程如图2E所示。
模型选择
我们探索了多种模型(线性/非线性、参数化/非参数化、单一/集成学习等),以确定最适合预测血脂的模型。每次迭代中的选择过程基于AutoGluon中的堆叠交叉验证方法。我们使用10折交叉验证数据构建元特征,并将其与原始特征结合来训练元模型。计算置换重要性以获得特征排名,然后将其用于下一次元模型的训练。
特征选择
除了探索多种模型,我们还专注于数据的特征选择。考虑到维度灾难的影响(即特征过多)、去除无关特征后模型可解释性的增加以及减少训练和推理时间,我们在每次迭代中进行置换重要性特征排名,选择重要特征用于训练下一个模型。这一过程有助于增强我们集成模型的性能。
归因分析
我们解释了我们的集成模型,以识别影响血脂的更具体因素。具体来说,我们使用Shapley加性解释(SHAP)方法进行归因分析。与早期方法相比,SHAP值的优势在于它们反映了每个特征对每个样本的影响,包括正面或负面效应。对于每个预测样本,模型生成一个预测值,SHAP值代表该样本中每个特征的分配值,称为贡献分数。如果贡献分数大于零,则表示对模型预测有正面影响,而分数小于零则表示负面影响。在实验过程中,我们使用Python中的SHAP模型解释包的KernelExplainer来解释模型预测,并为每个特征对预测的贡献进行分析。
统计分析和图表绘制
统计分析在GraphPad Prism 8.2.1或R软件中进行。所有测试的统计细节均包含在图例中。n表示独立重复次数。对α多样性相关分析使用单因素方差分析(Oneway ANOVA)计算显著性。多组样本之间的统计差异通过Kruskal-Wallis检验确定。通过相关性分析测试各组样本之间的关联性。该分析基于R函数cor.test进行斯皮尔曼秩相关检验。部分生物信息学数据的呈现使用了Wekemo Bioincloud平台。不显著:p> 0.05;*pppp
代码和数据可用性
序列数据已存入NCBI序列读取档案库,BioProject编号为(PRJNA1108019,https://www.ebi.ac.uk/ena/browser/view/PRJNA1108019)。使用的数据和脚本已保存在GitHub上:https://github.com/Dr-Rgx/imeta-Milk-fat-and-Blood-Lipid。补充材料(方法、图表、表格、图形摘要、幻灯片、视频、中文翻译版和更新材料)可在在线DOI或iMeta Science网站找到:http://www.imeta.science/。引文格式:
Ren, Guang-Xu, Liang He, Yong-Xin Liu, Yu-Ke Fei, Xiao-Fan Liu, Qiu-Yi Lu, Xin Chen, Zhi-Da Song, and Jia-Qi Wang.2024.“The Long-Term Intake of Milk Fat Does Not Significantly Increase the Blood Lipid Burden in Normal and High-Fat Diet-Fed Mice.” iMeta3. e256. https://doi.org/10.1002/imt2.256.
作者简介
任广旭(第一作者)
● 农业农村部食物与营养发展研究所,研究员,中国营养膳食协同创新平台秘书长。
● 主要从宿主肠道微生物的角度探索食物及其功能性物质调控人体健康的机制,相关成果陆续在Clinical nutrition, Trends in Food Science & Technology, Food & Function, Bone Marrow Transplant, Nutrition research,Journal of immunology及AIDS等刊物发表论文20多篇。主持国家自然科学基金,北京市自然科学基金以及国家重点研发子课题。
何亮(第一作者)
● 清华大学电子工程系,援疆干部,新疆大学智能与科学技术学院院长,兼计算机科学与技术学院常务副院长,教授、博士生导师,中文信息学会开源情报技术专委会秘书长、全国高校黄大年式教师团队成员。
● 主要从事高精度可解释智能建模理论与方法研究,相关成果在Nature Communication(Featured Articles)、IEEE TASLP、KBS、AWM、JASA、ICASSP、EMNLP和Interspeech等发表论文100余篇。主持6项国家级项目和1项自治区重点研发计划课题等各类科研项目20余项。
刘永鑫(第一作者)
● 中国农科院深圳基因组所研究员,微生物组与营养健康团队首席,iMeta期刊执行主编,宏基因组公众号创始人,中国微生物学会微生物组专委会委员。
● 研究方向聚焦微生物组学方法开发、功能挖掘和科学传播,以第一或通讯作者(含共同) 在Nature Biotechnology、Nature Microbiology 等发表研究论文40余篇,在Current Opinion in Microbiology、Protein Cell等撰写综述20余篇,合作在Science、Cell Host & Microbe等期刊发表论文20余篇,累计发文80余篇,被引用22000余次,连续入选全球前2%顶尖科学家榜单。创办宏基因组公众号,17万+同行关注,累计阅读量超6千万。主编《微生物组实验手册》专著,联合152家单位的352位同行参与,共同打造本领域长期更新的中文百科全书。发起iMeta期刊并任执行主编,影响因子23.8位列微生物学科研究类期刊全球第一。为Nature Communications、Microbiome、ISME、NAR等90余期刊审稿260次。
王加启(通讯作者)
● 中国农科院牧医所奶业创新团队首席科学家,研究员、博士生导师,国家973计划项目首席科学家,国家奶业科技创新联盟理事长。
● 主要从事奶牛营养与牛奶质量安全研究。研究揭示奶牛瘤胃微生物氮营养代谢与脲酶活性的调控机制,阐明牛奶重要品质形成的奶牛饲料与营养调控机理,解析乳铁蛋白等活性因子增强健康功能的代谢途径,提出奶类具有基础营养与活性营养双重营养功能的科学理念,发起并实施优质乳工程,引领奶业发展由数量型增长向安全优质转型升级。获国家科技进步奖二等奖3项,在Microbiome、Food Chemistry、Journal of Dairy Science等期刊上发表SCI论文100余篇。
更多推荐
(▼ 点击跳转)
高引文章 ▸▸▸▸
iMeta | 引用15000+,海普洛斯陈实富发布新版fastp,更快更好地处理FASTQ数据
高引文章 ▸▸▸▸
iMeta | 兰大张东组:使用PhyloSuite进行分子系统发育及系统发育树的统计分析
高引文章▸▸▸▸
iMeta | 唐海宝/张兴坦-用于比较基因组学分析的多功能分析套件JCVI
1卷1期
1卷2期
1卷3期
1卷4期
2卷1期
2卷2期
2卷3期
2卷4期
3卷1期
3卷2期
3卷3期
3卷4期
3卷5期
1卷1期
1卷2期
期刊简介
“iMeta” 是由威立、宏科学和本领域数千名华人科学家合作出版的开放获取期刊,主编由中科院微生物所刘双江研究员和荷兰格罗宁根大学傅静远教授担任。目的是发表所有领域高影响力的研究、方法和综述,重点关注微生物组、生物信息、大数据和多组学等前沿交叉学科。目标是发表前10%(IF > 20)的高影响力论文。期刊特色包括中英双语图文、双语视频、可重复分析、图片打磨、60万用户的社交媒体宣传等。2022年2月正式创刊!相继被Google Scholar、PubMed、SCIE、ESI、DOAJ、Scopus等数据库收录!2024年6月获得首个影响因子23.8,位列全球SCI期刊前千分之五(107/21848),微生物学科2/161,仅低于Nature Reviews,学科研究类期刊全球第一,中国大陆11/514!
“iMetaOmics” 是“iMeta” 子刊,主编由中国科学院北京生命科学研究院赵方庆研究员和香港中文大学于君教授担任,是定位IF>10的高水平综合期刊,欢迎投稿!
iMeta主页:
姊妹刊iMetaOmics主页:
出版社iMeta主页:
出版社iMetaOmics主页:
iMeta投稿:
iMetaOmics投稿:
邮箱:
office@imeta.science
来源:微生物组