太阳城集团

  • / 222
  • 下载费用:30 金币  

辅助大肠癌的再发风险诊断的计算机系统、程序及方法.pdf

摘要
申请专利号:

太阳城集团CN201510621189.0

申请日:

2015.09.25

公开号:

CN105468893A

公开日:

2016.04.06

当前法律状态:

实审

有效性:

审中

法律详情: 实质审查的生效IPC(主分类):G06F 19/00申请日:20150925|||公开
IPC分类号: G06F19/00(2011.01)I 主分类号: G06F19/00
申请人: 希森美康株式会社
发明人: 后藤健吾; 吉田雄一郎; 大友泰裕
地址: 日本兵库县
优先权: 2014-197018 2014.09.26 JP; 2015-082645 2015.04.14 JP; 2015-183024 2015.09.16 JP
专利代理机构: 中国国际贸易促进委员会专利商标事务所11038 代理人: 郑天松
PDF完整版下载: PDF下载
法律状态
申请(专利)号:

太阳城集团CN201510621189.0

授权太阳城集团号:

|||

法律状态太阳城集团日:

2016.05.04|||2016.04.06

法律状态类型:

太阳城集团实质审查的生效|||公开

摘要

由本发明提供大肠癌的再发风险的判断中使用的计算机系统。此计算机系统具备含处理器和存储器的计算机。在此存储器中记录有使在上述计算机中实行的计算机程序,接收从自大肠癌患者采集的活体样品中的第18染色体长链上的18q21~18q23的区域中存在的第1基因组选择的多个基因的表达量,接收从自大肠癌患者采集的活体样品中的第20染色体长链上的20q11~20q13的区域中存在的第2基因组选择的多个基因的表达量,以及接收从自大肠癌患者采集的活体样品中的含ANGPTL2、AXL、C1R、C1S、CALHM2、CTSK、DCN、EMP3、GREM1、ITGAV、KLHL5、MMP2、RAB34、SELM、SRGAP2P1及VIM的第3基因组选择的多个基因的表达量的工序,及基于接收的表达量,判断上述患者的大肠癌的再发风险的工序。

权利要求书

1.大肠癌的再发风险的判断中使用的计算机系统,其具备含处理
器和存储器的计算机,在上述存储器中记录有使在上述计算机中实行
下列工序的计算机程序:
如下工序:
接收从自大肠癌患者采集的活体样品中的第18染色体长链上的
18q21~18q23的区域中存在的第1基因组选择的多个基因的表达量,
接收从自大肠癌患者采集的活体样品中的第20染色体长链上的
20q11~20q13的区域中存在的第2基因组选择的多个基因的表达量,
以及
接收从自大肠癌患者采集的活体样品中的含ANGPTL2、AXL、
C1R、C1S、CALHM2、CTSK、DCN、EMP3、GREM1、ITGAV、
KLHL5、MMP2、RAB34、SELM、SRGAP2P1及VIM的第3基因
组选择的多个基因的表达量,
基于接收的表达量,判断上述患者的大肠癌的再发风险的工序。
2.权利要求1所述的计算机系统,其中在上述判断工序中,
当上述第3基因组是高表达时,判断为再发风险高,
当上述第1基因组是低表达、且上述第3基因组是低表达时,判
断为再发风险为中度,
当上述第1基因组是高表达,上述第2基因组是高表达、且上述
第3基因组是低表达时,判断为再发风险为中度,
当上述第1基因组是高表达,上述第2基因组是低表达、且上述
第3基因组是低表达时,判断为再发风险低。
3.权利要求1所述的计算机系统,其中
上述存储器存储高风险组的表达量、中风险组的表达量及低风险
组的表达量,
上述处理器:
接收上述测定工序中测定的表达量,
自上述存储器读取上述高风险组的表达量、上述中风险组的表
达量及上述低风险组的表达量,
比较上述测定工序中测定的表达量和上述高风险组的表达量,
比较上述测定工序中测定的表达量和上述中风险组的表达量,
比较上述测定工序中测定的表达量和上述低风险组的表达量,
将上述活体样品的再发风险分类为相关最高的风险组,
上述高风险组的表达量
是显示
选自上述第1基因组的多个基因、
选自上述第2基因组的多个基因、及
选自上述第3基因组的多个基因
的表达量的值,
是自被判断为再发风险高的患者组的活体样品预先测定的值,
上述中风险组的表达量
是显示
选自上述第1基因组的多个基因、
选自上述第2基因组的多个基因、及
选自上述第3基因组的多个基因
的表达量的值,
是自被判断为再发风险中度的患者组的活体样品预先测定的
值,
上述低风险组的表达量
是显示
选自上述第1基因组的多个基因、
选自上述第2基因组的多个基因、及
选自上述第3基因组的多个基因
的表达量的值,
是自被判断为再发风险低的患者组的活体样品预先测定的值。
4.权利要求3所述的计算机系统,其中上述处理器:
算出在上述测定工序中测定的表达量和上述高风险组的表达量的
相关系数,
算出在上述测定工序中测定的表达量和上述中风险组的表达量的
相关系数,
算出在上述测定工序中测定的表达量和上述低风险组的表达量的
相关系数,
将上述活体样品的再发风险分类为相关系数最高的风险组。
5.权利要求1所述的计算机系统,其中在上述判断工序中,
不管从第1及第2基因组各自选择的基因的表达量,当选自第3
基因组的基因的表达量在对于该基因的基准值以上时,判断为再发风
险高,
不管选自第2基因组的基因的表达量,当选自第3基因组的基因
的表达量相比对于该基因的基准值更小,选自第1基因组的基因相比
对于该基因的基准值更小时,判断为再发风险为中度,
当选自第3基因组的基因的表达量相比对于该基因的基准值更
小,选自第1基因组的基因的表达量是对于该基因的基准值以上,选
自第2基因组的基因的表达量在对于该基因的基准值以上时,判断为
再发风险为中度,
当选自第3基因组的基因的表达量相比对于该基因的基准值更
小,选自第1基因组的基因的表达量是对于该基因的基准值以上,选
自第2基因组的基因的表达量相比对于该基因的基准值更小时,判断
为再发风险低。
6.权利要求1所述的计算机系统,其中第1基因组含C18orf22、
C18orf55、CCDC68、CNDP2、CYB5A、LOC400657、LOC440498、
MBD2、MBP、MYO5B、NARS、PQLC1、RTTN、SEC11C、SOCS6、
TNFRSF11A、TXNL1、TXNL4A、VPS4B及ZNF407。
7.权利要求1所述的计算机系统,其中第2基因组含ASXL1、
C20orf112、C20orf177、CHMP4B、COMMD7、CPNE1、DIDO1、
DNAJC5、KIF3B、NCOA6、PHF20、PIGU、PLAGL2、POFUT1、
PPP1R3D、PTPN1、RBM39、TAF4及TCFL5。
8.权利要求1所述的计算机系统,其还具备测定上述各基因的表
达量,向上述计算机发送上述表达量的太阳城集团的测定装置。
9.权利要求1所述的计算机系统,其中上述计算机程序使上述计
算机还实行接收太阳城集团上述活体样品中的KRAS基因的变异的有无的信
息的工序。
10.权利要求9所述的计算机系统,其中在上述判断工序中,
对于上述再发风险作为中度的组,
当有KRAS基因变异时,作为再发风险高,
当无KRAS基因变异时,作为再发风险低。
11.权利要求9所述的计算机系统,其还具备检测上述KRAS基
因的变异的有无,向上述计算机发送上述变异的有无的太阳城集团的变异检
测装置。
12.权利要求1~11之任一项所述的计算机系统,其中上述接收
工序接收以下的全部的基因的表达量:C18orf22、C18orf55、CCDC68、
CNDP2、CYB5A、LOC400657、LOC440498、MBD2、MBP、MYO5B、
NARS、PQLC1、RTTN、SEC11C、SOCS6、TNFRSF11A、TXNL1、
TXNL4A、VPS4B、ZNF407、ASXL1、C20orf112、C20orf177、
CHMP4B、COMMD7、CPNE1、DIDO1、DNAJC5、KIF3B、NCOA6、
PHF20、PIGU、PLAGL2、POFUT1、PPP1R3D、PTPN1、RBM39、
TAF4、TCFL5、ANGPTL2、AXL、C1R、C1S、CALHM2、CTSK、
DCN、EMP3、GREM1、ITGAV、KLHL5、MMP2、RAB34、SELM、
SRGAP2P1及VIM。
13.由计算机实行的计算机程序,其中,
上述计算机程序对于上述计算机实行下列工序:
如下工序:
接收从自大肠癌患者采集的活体样品中的第18染色体长链上的
18q21~18q23的区域中存在的第1基因组选择的多个基因的表达量,
接收从自大肠癌患者采集的活体样品中的第20染色体长链上的
20q11~20q13的区域中存在的第2基因组选择的多个基因的表达量,
以及
接收从自大肠癌患者采集的活体样品中的含ANGPTL2、AXL、
C1R、C1S、CALHM2、CTSK、DCN、EMP3、GREM1、ITGAV、
KLHL5、MMP2、RAB34、SELM、SRGAP2P1及VIM的第3基因
组选择的多个基因的表达量,
基于接收的表达量,判断上述患者的大肠癌的再发风险的工序。
14.辅助诊断大肠癌的再发风险的方法,其包括:
进行下列测定的测定工序:
各自测定从大肠癌患者采集的活体样品中的选自第18染色体长
链上的18q21~18q23的区域中存在的第1基因组的多个基因的表达
量的第1测定、
各自测定从大肠癌患者采集的活体样品中的选自第20染色体长
链上的20q11~20q13的区域中存在的第2基因组的多个基因的表达
量的第2测定、以及
各自测定从大肠癌患者采集的活体样品中的选自含ANGPTL2、
AXL、C1R、C1S、CALHM2、CTSK、DCN、EMP3、GREM1、ITGAV、
KLHL5、MMP2、RAB34、SELM、SRGAP2P1及VIM的第3基因
组的多个基因的表达量的第3测定,
基于在上述测定工序中测定的表达量,判断上述患者的大肠癌的
再发风险的工序。

说明书

辅助大肠癌的再发风险诊断的计算机系统、程序及方法

【技术领域】

本发明涉及辅助诊断大肠癌的再发风险的方法。特别涉及对于从
大肠癌患者的组织得到的核酸,取得属于指定基因组的基因的表达量
数据,基于取得的表达量数据,辅助该患者的大肠癌的再发风险的诊
断的方法、程序及计算机系统。

【背景技术】

大肠癌是在盲肠、结肠、直肠中发生的癌症肿瘤的总称。与多种
癌同样地,在大肠癌中,早期的发现对于其治疗也是重要的。在癌的
治疗中,有时使用有很强的副作用的抗癌剂,在此时患者被加以大的
负担。为了降低这样的患者的负担,医师根据患者选择最适的治疗法
是重要的,为此,医师有必要确切掌握患者的癌的进展程度、恶性度、
症状等。

另外,正确地预测患者的预后对于患者的预后中的QOL(生活质
量)的提高是重要的。作为用于进行大肠癌的预后预测的方法,已知
有作为组织病理学方法的Dukes分类。Dukes分类在国际上广泛使用,
根据癌的浸润的程度分类为DukesA、B、C及D的任何一种的方法。
Dukes分类由于是医师用肉眼进行的分类法,有易发生因医师造成的
误差的问题。另外,也有容易由取得大肠癌组织的设施的差异发生诊
断差异的问题。

近年,在开展对于关注特定的基因的表达量的增减的,使用基因
标志物的癌的预后预测的研究。例如,在US专利公开2008/058432
中公开了,诊断为大肠癌的,或者接受大肠癌的治疗的患者中的用于
预测大肠癌的再发的分子的解析。US专利公开2008/058432中公开的
技术是进行对特定的大肠癌的再发的预后预测的技术,存在无法适用
于全部大肠癌的问题。

【发明内容】

【发明要解决的技术课题】

本发明旨在对于各种的病例的大肠癌,提供信赖性高的大肠癌的
再发风险的诊断辅助方法、程序及计算机系统。

【解决课题的技术方案】

本发明人为解决上述的课题,重复锐意研究的结果发现,由聚类
分析,可将大肠癌分为3种类型。并且发现,此3个类型与大肠癌的
预后关联,且得到的结果充分地稳定,由此完成本发明。

由本发明提供大肠癌的再发风险的判断中使用的计算机系统。

此计算机系统具备含处理器和存储器的计算机。

在此存储器中记录有使在上述计算机中实行的计算机程序,

接收从自大肠癌患者采集的活体样品中的第18染色体长链上的
18q21~18q23的区域中存在的第1基因组选择的多个基因的表达量,
接收自第20染色体长链上的20q11~20q13的区域中存在的第2基因
组选择的多个基因的表达量,以及,接收自含ANGPTL2、AXL、C1R、
C1S、CALHM2、CTSK、DCN、EMP3、GREM1、ITGAV、KLHL5、
MMP2、RAB34、SELM、SRGAP2P1及VIM的第3基因组选择的多
个基因的表达量的工序,及

基于接收的表达量,判断上述患者的大肠癌的再发风险的工序。

【发明效果】

由本发明可提供信赖性高的大肠癌再发风险的诊断辅助方法。

【附图说明】

【图1】是显示本发明的诊断辅助方法中使用的诊断辅助装置之
一例的概略图。

【图2】是显示诊断辅助装置的软件的功能构成的框图。

【图3】是显示诊断辅助装置的硬件的构成的框图。

【图4】是显示诊断辅助装置的动作的流程图。

【图5】是显示训练组的病例中的再发风险组分类的结果的图。

【图6】是显示各风险组的再发风险的Kaplan-Meier曲线。

【图7】是显示训练组及验证组1的病例中的再发风险组分类的
结果的图。

【图8】是显示验证组2的病例中的再发风险组分类的结果的图。

【图9】是显示验证组3的病例中的再发风险组分类的结果的图。

【图10】是验证组3的病例中的由再发风险组分类的
Kaplan-Meier曲线。

【图11】是显示验证组4的病例中的再发风险组分类的结果的图。

【图12】是验证组4的病例中的由再发风险组分类的
Kaplan-Meier曲线。

【图13】是训练组的病例中的由Dukes分类的Kaplan-Meier曲
线。

【图14】是在实施例4中将中风险组由KRAS基因变异的有无层
别化的再发风险分类结果的Kaplan-Meier曲线。

【图15】是在实施例5中将中风险组由KRAS基因变异的有无层
别化的再发风险分类结果的Kaplan-Meier曲线。

【图16】是显示实施例8的FFPE组织待测样品18病例中的再
发风险组分类的结果的图。

【图17】是将实施例8的FFPE组织待测样品18病例中的中风
险组由KRAS基因变异的有无层别化的再发风险分类结果的
Kaplan-Meier曲线。

【图18】是在实施例10中得到的Kaplan-Meier曲线。

【图19】是显示诊断辅助装置的动作的流程图。

【实施方式】

以下参照附图说明本发明的优选实施方式。

在本实施方式的大肠癌再发风险的诊断辅助方法(以下,有时记
作“诊断辅助方法”)中,首先进行,各自测定从大肠癌患者采集的活
体样品中的选自第18染色体长链上的18q21~18q23的区域中存在的
第1基因组的多个基因的表达量的第1测定、各自测定选自第20染色
体长链上的20q11~20q13的区域中存在的第2基因组的多个基因的
表达量的第2测定、以及,各自测定选自含ANGPTL2、AXL、C1R、
C1S、CALHM2、CTSK、DCN、EMP3、GREM1、ITGAV、KLHL5、
MMP2、RAB34、SELM、SRGAP2P1及VIM的第3基因组的多个基
因的表达量的第3测定。

作为“活体样品”,只要是含大肠癌患者的肿瘤细胞来源的核酸(例
如mRNA)的,就不特别限定,例如可使用临床待测样品。作为临床
待测样品,具体可举出血液、血清、由手术或活体检查采集的组织等。
另外,也可将自被检者采集的组织的福尔马林固定石蜡包埋(FFPE)
样品作为活体样品使用。

本实施方式的方法在测定工序之前,也可含从活体样品提取DNA
的工序。从活体样品提取DNA的方法可由现有技术中公知的方法进
行。例如,离心分离活体样品而使含DNA的细胞沉淀,由物理学方
法或化学方法破坏此细胞,通过除去细胞碎片,可得到DNA提取物。
此操作也可使用市售的DNA提取试剂盒等进行。

在本说明书中,“第1基因组”是指第18染色体长链上的18q21~
18q23的区域中存在的基因的总称。具体而言,第1基因组含由基因
符号C18orf22(笫18染色体阅读框22)、C18orf55(笫18染色体阅
读框55)、CCDC68(卷曲螺旋结构域含68)、CNDP2(CNDP二
肽酶2(金属肽酶M20家族))、CYB5A(细胞色素b5A型(微粒
体))、LOC400657(假想LOC400657)、LOC440498(热休克因
子结合蛋白1-样)、MBD2(甲基-CpG结合结构域蛋白2)、MBP
(髓磷脂碱蛋白)、MYO5B(肌球蛋白VB)、NARS(天冬酰胺酰
-tRNA合成酶)、PQLC1(PQ环重复含1)、RTTN(Rotatin)、
SEC11C(SEC11同系物C(啤酒糖酵母(S.cerevisiae)))、SOCS6
(细胞因子信号传导阻遏物6)、TNFRSF11A(肿瘤坏死因子受体超
家族,成员11a,NFKB活化物)、TXNL1(硫氧还蛋白-样1)、TXNL4A
(硫氧还蛋白-样4A)、VPS4B(液泡蛋白分选4同系物B(啤酒糖
酵母(S.cerevisiae)))及ZNF407(锌指蛋白407)表示的基因。

在本说明书中,“第2基因组”是指第20染色体长链上的20q11~
20q13的区域中存在的基因的总称。具体而言,第2基因组含由基因
符号ASXL1(另外的性梳样1(果蝇属(Drosophila)))、C20orf112
(笫20染色体阅读框112)、C20orf177(笫20染色体阅读框177)、
CHMP4B(染色质修饰蛋白4B)、COMMD7(COMM结构域含7)、
CPNE1(copineI)、DIDO1(死亡诱导物-闭塞物1)、DNAJC5(DnaJ
(Hsp40)同系物,亚家族C,成员5)、KIF3B(驱动蛋白家族成员
3B)、NCOA6(核受体共活化物6)、PHF20(PHD指蛋白20)、
PIGU(磷脂酰肌醇聚糖锚定生物合成,U类)、PLAGL2(多形腺瘤
基因-样2)、POFUT1(蛋白O-岩藻糖基转移酶1)、PPP1R3D(蛋
白磷酸酶1,调控(抑制物)亚基3D)、PTPN1(蛋白酪氨酸磷酸酶,
非-受体1型)、RBM39(RNA结合基序蛋白39)、TAF4(TAF4RNA
聚合酶II,TATAbox结合蛋白(TBP)-相关因子,135kDa)及TCFL5
(转录因子-样5(碱性螺旋-环-螺旋))表示的基因。

在本说明书中,“第3基因组”是指在生物学上含被称作间质关联
基因、EMT关联基因等的基因的总称。具体而言,第3基因组含由基
因符号ANGPTL2(血管生成素-样2)、AXL(AXL受体酪氨酸激酶)、
C1R(补体成分1,r亚成分)、C1S(补体成分1,s亚成分)、CALHM2
(钙内稳态调节物2)、CTSK(组织蛋白酶K)、DCN(Decorin)、
EMP3(上皮膜蛋白3)、GREM1(gremlin1,半胱氨酸结超家族,
同系物(光滑爪蟾(Xenopuslaevis)))、ITGAV(整联蛋白,αV
(玻连蛋白受体,α多肽,抗原CD51))、KLHL5(kelch-样5(果
蝇属(Drosophila)))、MMP2(基质金属肽酶2(明胶酶A,72kDa
明胶酶,72kDatypeIV胶原酶))、RAB34(RAB34,成员RAS癌
基因家族)、SELM(硒蛋白M)、SRGAP2P1(SLIT-ROBOρGTP
酶活化蛋白2假基因1)及VIM(波形蛋白)表示的基因。在本说明
书中,第3基因组有时记作“间质关联基因组”。

在本实施方式的诊断辅助方法中,使用这3个的基因组,判断大
肠癌的再发风险。

在本说明书中,“基因的转录产物”是指通过基因转录得到的产物,
是核糖核酸(RNA)、具体而言是信使RNA(mRNA)。

另外,在本说明书中,“基因的表达量”是指上述的活体样品中的
基因的转录产物的存在量或反映该存在量的物质的量。从而,由本实
施方式的诊断辅助方法可测定基因的转录产物(mRNA)的量、或者
自mRNA得到的互补脱氧核糖核酸(cDNA)或互补RNA(cRNA)
的量。通常、由于活体样品中的mRNA是微量,优选测定从其由逆转
录及体外转录(IVT)得到的cDNA或cRNA的量。

从活体样品提取基因的转录产物的方法可使用现有技术中已知的
RNA提取法进行。例如,通过离心分离活体样品,使含RNA的细胞
沉淀,由物理学方法或酶学方法破坏该细胞,除去细胞碎片而可得到
RNA提取物。RNA的提取也可使用市售的RNA提取试剂盒等进行。

也可进行用于从如上述一样得到的基因的转录产物的提取物,除
去基因的表达量的测定时优选不混入的活体样品来源的混入成分、例
如,活体样品是血液时球蛋白的mRNA等的处理。

对于如上述一样得到的基因的转录产物的提取物,从第1~第3
基因组各自测定多个、优选为至少5个选择的基因的表达量。通过测
定5个以上的基因的表达量,因为可使指定的基因的表达偶然高的或
低时等发生的生物学的偏差及测定误差降低,从而具有更高的信赖性,
可辅助再发风险诊断。

基因的表达量的测定可根据公知的方法进行,但在本实施方式的
再发风险诊断辅助方法中,使用核酸芯片的测定方法、优选为使用所
谓的微阵列的方法。

使用微阵列测定基因的表达量时,例如,使基板上固定的20~25
聚体程度的核酸探针与基因的转录产物的提取物或由基因的转录产物
制作的cDNA或cRNA接触,可将杂交体的形成的有无通过测定荧光、
显色、电流等的指标的变化,测定目的基因的表达量。

上述的核酸探针是,对于1个基因的转录产物使用至少1个即可,
根据基因的转录产物的长度等,也可使用多个探针。本领域技术人员
可根据要测定的基因的转录产物的序列适宜确定探针的序列。

作为使用核酸芯片的基因的表达量的测定方法,例如,可使用由
Affymetrix公司提供的GeneChip系统。

使用核酸芯片时,基因的转录产物或其cDNA或cRNA,为了容
易形成与核酸探针的杂交体,也可片段化。片段化可由现有技术中公
知的方法进行,例如,可使用核糖核酸酶、脱氧核糖核酸酶等的核酸
分解酶进行。

在测定工序中,多个基因的表达量的测定可各自分别进行,也可
同时进行一部分的基因或全部的基因的测定。例如使用核酸芯片时,
可用1个核酸芯片同时进行第1测定、第2测定及第3测定。

在核酸芯片中与核酸探针接触的基因的转录产物或其cDNA或
cRNA通常只要是5~20μg左右即可。接触条件通常是于45℃16小时
左右。

与核酸探针接触而形成杂交体的基因的转录产物或其cDNA或
cRNA,可对于其杂交体形成的有无及杂交体形成的量,基于荧光物
质、染料或通过杂交体形成的流过核酸芯片上的电流量的变化等检测。

将杂交体的形成由荧光物质或染料的检测测定时,基因的转录产
物或其cDNA或cRNA优选被用于荧光物质或染料的检测的标记物质
标记。这样的标记物质可使用现有技术中通常使用的。通常、通过将
生物素化核苷酸或生物素化核糖核苷酸,作为合成cDNA或cRNA时
的核苷酸或核糖核苷酸底物混合,得到的cDNA或cRNA可用生物素
标记。cDNA或cRNA被生物素标记,则在核酸芯片上可结合作为对
生物素的结合偶体的亲和素或链霉亲和素。亲和素或链霉亲和素通过
与适宜的荧光物质或染料结合,可检测杂交体的形成。作为荧光物质,
可举出异硫氰酸荧光素(FITC)、绿色荧光蛋白(GFP)、荧光素、
藻红蛋白等。通常、由于藻红蛋白-链霉亲和素的缀合物被市售,所以
使用其是简便的。

另外,也可使针对亲和素或链霉亲和素的标记抗体与亲和素或链
霉亲和素接触,检测标记抗体的荧光物质或染料。

在此工序中得到的基因的表达量只要是相对表示活体样品中的各
基因的转录产物的存在量的值,就不特别限定。由上述的核酸芯片进
行测定时,表达量可为自基于荧光强度、显色强度、电流量等的核酸
芯片得到的信号。

这些信号可使用核酸芯片用的测定装置测定。

来自多个自大肠癌患者采集的活体样品得到的基因的表达量的数
据可由聚类等聚类化。聚类化,例如可使用最接近距离法进行。最接
近距离法是指通过算出各要素间的距离,依次结合距离近的要素,阶
段性地进行聚类,阶层聚类方法。在本实施方式中,“活体样品”与“要
素”相当,该要素间的“基因的表达量的差”与“距离”相当。

接下来,在本实施方式的判断工序中,基于测定工序中得到的基
因的表达量的数据,判断大肠癌的再发风险。

判断工序可使用各种的解析方法。

例如,基于活体样品中的选自第1基因组的基因的表达量和基准
值的比较、活体样品中的选自第2基因组的基因的表达量和基准值的
比较、及活体样品中的选自第3基因组的基因的表达量和基准值的比
较进行判断。

在本发明的优选的实施方式中,在判断工序中,不管从第1及第
2基因组各自选择的基因的表达量,选自第3基因组的基因的表达量
在对该基因的基准值以上时,判断为再发风险高。

即,在选自第3基因组的基因的表达量是对于该基因的基准值以
上时,从第1及第2基因组各自选择的基因的表达量可为对这些的基
因各自的基准值以上,或者可相比所述基准值更小,也判断为再发风
险高。

在本发明的优选的实施方式中,在判断工序中,不管选自第2基
因组的基因的表达量,在选自第3基因组的基因的表达量相比对于其
基因的基准值更小,选自第1基因组的基因相比对于该基因的基准值
更小时,判断为再发风险为中度。

即,在选自第3基因组的基因的表达量相比对于该基因的基准值
更小,并且,选自第1基因组的基因的表达量相比对于该基因的表达
量更小时,即使选自第2基因组的基因的表达量是对于该基因的基准
值以上,或者可相比所述基准值更小,也判断为再发风险为中度。

在本发明的优选的实施方式中,在判断工序中,选自第3基因组
的基因的表达量相比对于该基因的基准值更小,选自第1基因组的基
因的表达量是对于该基因的基准值以上,选自第2基因组的基因的表
达量在对该基因的基准值以上时,判断为再发风险为中度。

在本发明的优选的实施方式中,提供大肠癌的再发风险的诊断辅
助方法,其在判断工序中,在选自第3基因组的基因的表达量相比对
于该基因的基准值更小,选自第1基因组的基因的表达量是对于该基
因的基准值以上,选自第2基因组的基因的表达量相比对于该基因的
基准值更小时,判断为再发风险低。

在上述的实施方式中,各基因组的“基准值”设定为可判断各基因
组过量表达与否的值。例如,第1基因组的“基准值”如以下一样取得。
首先,在特定的患者组中,算出各基因的表达量的平均值。例如,各
自测定患者组中含的各患者的C18orf22表达量,通过表达量的总和除
以患者数,可取得患者组的C18orf22表达量的平均值。对于第1基因
组中含的其他基因也同样地取得平均值。通过这些基因的平均值的总
和除以基因数,可取得特定的患者组中的第1基因组的平均值。可将
此平均值作为“基准值”。对于第2基因组及第3基因组也可同样地取
得“基准值”。

其中,作为基准值例示“平均值”,但除平均值之外,也可使用中
位值或最频值等。

此基准值优选在实施测定工序及判断工序之前,预先取得。

在本实施方式的优选的实施方式中,使活体样品中的各基因的表
达量的总和除以基因数,取得活体样品的基因表达量的平均值,将此
活体样品的基因表达量与上述的基准值比较。

在本说明书中,“基准值”可自大肠癌患者中的选自第1~第3基
因组的基因的表达量的数据的蓄积适宜设定。例如,基准值是多个患
者中的基因的表达量的数据的平均值。由于成为对象的患者的数(n)
越多,上述的表达量的数据的平均值越收敛,从而可减小平均值的偏
差。

由本发明的别的实施方式,基于活体样品的基因表达模式和各患
者组的基因表达模式判断再发风险。在此方法中,不设定多个“基因
组”,根据再发风险设定多个患者组。具体而言,首先,将某患者组分
类为以下3组:判断为再发风险高的患者组(以下也称为“高风险组”)、
判断为再发风险为中度的患者组(以下也称为“中风险组”)及判断为
再发风险低的患者组(以下也称为“低风险组”)。

自这些各患者组的样品取得成为解析对象的基因的表达量,算出
平均值。例如,高风险组中含100人的患者,算出C18orf22的表达量
的平均值时,100人的患者的C18orf22的表达量的总和除以100的值
成为高风险组的C18orf22的表达量的平均值。对于中风险组及低风险
组也同样地算出C18orf22的表达量的平均值。另外,在本实施方式中,
由于多个基因成为解析对象,各自算出多个基因的表达量的平均值。
其中,将如此得到的高风险组中的表达量的平均值的数据组称为高风
险组表达模式,将中风险组中的表达量的平均值的数据组称为中风险
组表达模式,将低风险组中的表达量的平均值的数据组称为高风险组
表达模式。在解析55个基因的表达量时,在高风险组表达模式中,成
为含55的值。

各风险组的表达模式在活体样品的基因表达的测定及再发风险的
判断之前,预先取得。

接下来,测定活体样品中的各基因的表达量。其中,将测定工序
中测定的各基因的表达量的数据组称为活体样品的表达模式。在测定
55个基因的表达量时,在活体样品的表达模式中,成为含55的值。

分析活体样品中的各基因的表达模式和各风险组的表达模式的相
关。特别指定与活体样品的表达模式显示最高的相关的风险组。对应
于特别指定的风险组的再发风险被判断为活体样品的再发风险。例如,
在活体样品中的各基因的表达量与高风险组显示最高的相关时,此活
体样品被判断为再发风险高。

在上述的相关的分析中,可使用各种方法。例如,算出活体样品
的表达模式和高风险组表达模式的相关系数、活体样品的表达模式和
中风险组表达模式的相关系数、及活体样品的表达模式和低风险组表
达模式的相关系数。比较各层间系数,将活体样品分类到显示最高的
相关系数的风险组,可进行再发风险的判断。例如,在与高风险组表
达模式的相关系数最高时,活体样品被分类为高风险组,判断为再发
风险高。

相关系数的算出可由公知的方法进行。例如,可基于Spearman
的次序相关、Pearson的积率相关、Kendall的次序相关等算出相关系
数。

作为分析与各风险组的相关的方法,也可使用聚类解析。例如,
可如以下一样进行解析。

预先在多个患者取得各基因的表达量(再有,在此太阳城集团点不进行
高风险组、中风险组及低风险组的分类)。在测定工序中,测定活体
样品中的各基因的表达量。将各患者的各基因的表达量和活体样品中
的各基因的表达量由聚类解析分类为高风险组、中风险组及低风险组。
基于活体样品被分类的风险组,可判断活体样品的再发风险。

除上述的解析方法之外、也可使用线形判别、由支持向量机的判
别等。

以上、对于各种解析方法进行说明,但由任何解析方法,结果都
如以下一样判断。

在第3基因组是高表达时,判断为再发风险高。

在第1基因组是低表达,并且第3基因组是低表达时,判断为再
发风险为中度。

在第1基因组是高表达,第2基因组是高表达,并且第3基因组
是低表达时,判断为再发风险为中度。

在第1基因组是高表达,第2基因组是低表达,并且第3基因组
是低表达时,判断为再发风险低。

在本发明的再优选的实施方式中,对于再发风险作为中度的组,
在KRAS基因有变异时判断为再发风险高,KRAS基因无变异时判断
为再发风险低。

KRAS基因是在第12染色体上的25.36~25.4Mb的位置存在的
基因,是ras癌基因之一种,具有向核传递上皮生长因子受体(EGFR)
的信号,促进细胞增殖的功能。将KRAS的cDNA的碱基序列以SEQ
IDNO:56表示。此碱基序列在人基因组数据库GenBank以登录编号
AF493917公知。

KRAS基因的变异是指,优选为相当于所述基因的外显子2序列
上存在的第12及13密码子(第34~39的碱基)的GGTGGC的碱基
序列中发生的变异或相当于外显子3序列中存在的第61密码子(第
182~184的碱基)的CAA的碱基序列中发生的变异。

KRAS变异的有无的测定方法不特别限定,可使用本领域技术人
员公知的方法进行。在本实施方式中,KRAS变异的有无的测定可使
用测序解析进行。

KRAS基因的变异的种类不特别限定,上述密码子中的任何的碱
基变异,则可判断为有变异。在本实施方式中,优选为,以引起KRAS
蛋白质的氨基酸序列的变异的碱基序列的变异(即,错义变异、无义
变异、移码变异等,沉默变异以外的变异)作为对象。变异的种类考
虑有核苷酸的取代、缺失、删除及附加,但在本实施方式中,优选为,
是取代。作为这样的取代的具体例,可举出第34G被A取代、第35G
被A、C或T取代、第38G被A取代、第182C被A取代、第184A
被C或T取代等。

如上所述,通过将KRAS变异的有无加到判断基准,可将中风险
组分类为高风险组和低风险组,可将全体分为高低2类。由此,对于
中风险组分类为高低之任何也变得可能,可对于更多种病例提供更有
用的太阳城集团。

在本发明中,也含用于在计算机中实行患者的大肠癌再发风险的
判断的计算机程序制品。计算机程序制品例示有,可经互联网等下载
的程序或记录所述程序的介质等。

例如,例示用于在计算机中实行如以下一样的工序的程序。

接收从大肠癌患者采集的活体样品中的自第18染色体长链上的
18q21~18q23的区域中存在的第1基因组选择的多个基因的表达量,
接收自第20染色体长链上的20q11~20q13的区域中存在的第2基因
组选择的多个基因的表达量,以及,接收自含ANGPTL2、AXL、C1R、
C1S、CALHM2、CTSK、DCN、EMP3、GREM1、ITGAV、KLHL5、
MMP2、RAB34、SELM、SRGAP2P1及VIM的第3基因组选择的多
个基因的表达量的工序;

基于接收的表达量,判断上述患者的大肠癌的再发风险的工序。

接下来,参照附图说明对于实施本实施方式的方法适宜的装置之
一形态。但是,本发明不仅限于此实施方式。图1是显示患者的大肠
癌再发风险的判断中使用的诊断辅助装置之一例的概略图。示于图1
的诊断辅助装置1含测定装置2和与该测定装置2连接的计算机系统
3。

在本实施方式中,测定装置2是核酸芯片用的测定装置。此测定
装置2取得基因的表达量本身及如核酸芯片的显色荧光的色相或荧光
强度一样的基因的表达量关联的太阳城集团。将自大肠癌患者采集的活体样
品设置于测定装置2,则测定装置2取得与该活体样品中的基因的表
达量关联的太阳城集团,向计算机系统3发送得到的太阳城集团。

对于判断为中风险的待测样品还进行大肠癌再发风险的高低判断
时,诊断辅助装置1除了测定装置2及与该测定装置2连接的计算机
系统3之外,还含变异测定装置4。

在本实施方式中,此变异测定装置4取得太阳城集团活体样品中的
KRAS基因的变异的有无的太阳城集团。将自大肠癌患者采集的活体样品设
置于变异测定装置4,则变异测定装置4取得太阳城集团该活体样品中的
KRAS基因的变异的有无的太阳城集团,向计算机系统3发送得到的太阳城集团。

计算机系统3含:计算机本体3a、由键盘或鼠标组成的输入部3b
及由LCD或CRT组成且表示待测样品太阳城集团或判断结果等的显示部
3c。计算机系统3从测定装置2及变异测定装置4,各自接收与基因
的表达量关联的太阳城集团及根据需要太阳城集团KRAS基因的变异的有无的信
息。然后,计算机系统3基于这些的太阳城集团,实行判断被检者的大肠癌
再发风险的程序。再有,从输入部3b可输入后述的“必要2组分类”。

图2是将诊断辅助装置1的计算机本体3a的软件用功能块显示的
框图。如图2所示,计算机具备接收部301、存储部302、算出部303、
判断部304和输出部305。接收部301可与测定装置2及根据需要变
异测定装置4经网络通信地连接。在判断部304,经输入部3b可输入
对于大肠癌再发风险判断的实施必要的太阳城集团、具体而言太阳城集团对于判断
为中风险的待测样品进行KRAS基因的变异有无的测定(2组分类)
与否的太阳城集团。

接收部301接收自测定装置2及变异测定装置4发送的太阳城集团。存
储部302存储用于算出对于判断必要的基准值及基因的表达量的式或
处理程序等。算出部303使用接收部301中取得的太阳城集团,根据存储的
式,算出基因的表达量。判断部304判断由接收部301取得的或者由
算出部303算出的基因的表达量是否在存储于存储部302的基准值以
上。输出部305将由判断部304的判断结果作为被检者的大肠癌再发
风险的判断结果而向显示部3c输出。

对于判断为中风险的待测样品再进行大肠癌再发风险的高低判断
时,接收部301,除了自测定装置2发送的太阳城集团之外,也还取得自变
异测定装置4发送的太阳城集团。存储部302除了对于判断必要的基准值及
用于算出基因的表达量的式之外,再存储KRAS基因的非变异序列。
算出部303使用接收部301中取得的太阳城集团,根据存储的式,算出基因
的表达量。判断部304除判断由接收部301取得的或者由算出部303
算出的基因的表达量是否在存储于存储部302的基准值以上外,还基
于在接收部301取得的KRAS基因的序列与存储部302中存储的
KRAS基因的非变异序列一致与否判断KRAS基因中的变异的有无。
输出部305将由判断部304的判断结果作为被检者的大肠癌再发风险
的判断结果而向显示部3c输出。

图3是显示图2所示的计算机本体3a的硬件构成的框图。如图3
所示,计算机本体3a具备CPU(中央处理器)30、ROM(只读存储
器)31、RAM32、硬盘33、输入输出界面34、读取装置35、通信接
口36和图像输出界面37。CPU30、ROM31、RAM(随机存储器)32、
硬盘33、输入输出界面34、读取装置35、通信接口36及图像输出界
面37可由总线38数据通信地连接。

CPU30可实行存储于ROM31的计算机程序及加载到RAM32的
计算机程序。CPU30通过实行计算机程序,实行示于图2的各功能。
由此,计算机系统3作为用于判断被检者的大肠癌再发风险的诊断辅
助装置发挥功能。

ROM31由掩模型ROM、PROM、EPROM、EEPROM等构成。
在ROM31中记录如前述一样由CPU30实行的计算机程序及其中使用
的数据。

RAM32由SRAM、DRAM等构成。RAM32在ROM31及硬盘
33中记录的计算机程序的读取中使用。RAM32,另外在实行这些计
算机程序时,作为CPU30的作业区域利用。

硬盘33上安装有用于在CPU30实行的操作系统、应用程序(用
于判断被检者的大肠癌再发风险的计算机程序)等的计算机程序及所
述计算机程序的实行中使用的数据。

读取装置35由软盘驱动器、CD-ROM驱动器、DVD-ROM驱动
器等构成。读取装置35可读取记录在可移动型记录介质40的计算机
程序或数据。

输入输出界面34由例如,USB、IEEE1394、RS-232C等的串行
界面、SCSI、IDE、IEEE1284等的并行界面及由D/A变换器、A/D
变换器等组成的类似物界面构成。在输入输出界面34连接有键盘、鼠
标等的输入部3b。操作者可由所述输入部3b向计算机本体3a输入各
种指令。

通信接口36例如,是Ethernet(注册商标)界面等。计算机本体
3a可由通信接口36向打印机等发送打印数据。

图像输出界面37与由LCD、CRT等构成的显示部3c连接。由
此,显示部3c可输出根据自CPU30给出的图像数据的影像信号。显
示部3c根据输入的影像信号显示图像(画面)。

接下来,说明由诊断辅助装置1的被检者的大肠癌再发风险判断
的处理顺序。图4是大肠癌再发风险判断的流程图。其中,将从使用
被检者来源的活体样品得到的显色荧光的太阳城集团算出荧光强度,从得到
的荧光强度算出基因的表达量,进行得到的表达量是基准值以上与否
的判断的情况作为例子进行说明。但是,本发明不仅限于此实施方式。

首先,在步骤S1-1中,诊断辅助装置1的接收部301从测定装置
2取得与选自第3基因组的基因的表达量关联的显色荧光的太阳城集团。接
下来,在步骤S1-2中,算出部303从取得的太阳城集团算出荧光强度,向存
储部302发送。然后,在步骤S1-3中,算出部303基于存储的该荧光
强度,根据存储的式,算出基因的表达量。

其后,在步骤S1-4中,判断部304进行在步骤S1-3中算出的表
达量是否在存储于存储部302的基准值以上的判断。其中,表达量是
基准值以上之时,程序向步骤S1-5进行,判断部304向输出部305发
送显示被检者的大肠癌再发风险高(高风险)的判断结果。另一方面,
在表达量相比基准值更低时,程序向步骤S1-6进行。

在步骤S1-6中,诊断辅助装置1的接收部301从测定装置2取得
与选自第1基因组的基因的表达量关联的显色荧光的太阳城集团。接下来,
在步骤S1-7中,算出部303从取得的太阳城集团算出荧光强度,向存储部
302发送。然后,在步骤S1-8中,算出部303基于存储的该荧光强度,
根据存储的式,算出基因的表达量。

其后,在步骤S1-9中,判断部304进行在算出部303中算出的表
达量是否在存储于存储部302的基准值以上的判断。其中,表达量是
基准值以上之时,程序向步骤S1-11进行。另外,在表达量相比基准
值更低时,程序向步骤S1-10进行,判断部304判断为被检者的大肠
癌再发风险为中度(中风险),其后程序向步骤S1-17进行。

在步骤S1-11中,诊断辅助装置1的接收部301从测定装置2取
得与选自第2基因组的基因的表达量关联的显色荧光的太阳城集团。接下来,
在步骤S1-12中,算出部303从取得的太阳城集团算出荧光强度,向存储部
302发送。然后,在步骤S1-13中,算出部303基于存储的该荧光强
度,根据存储的式,算出基因的表达量。

其后,在步骤S1-14中,判断部304进行在算出部303中算出的
表达量是否是存储于存储部302的基准值以上的判断。其中,表达量
是基准值以上之时,程序向步骤S1-15进行,判断部304判断为被检
者的大肠癌再发风险为中度(中风险),其后向步骤S1-17进行。另
一方面,在步骤S1-14中,在表达量相比基准值更低时,程序向步骤
S1-16进行,判断部304向输出部305发送显示被检者的大肠癌再发
风险低的判断结果(低风险)。

对于经步骤S1-10或S1-15判断为大肠癌再发风险为中度的待测
样品,在步骤S1-17中,在从输入部3b输入“必要2组分类”时,对于
这些待测样品进行由KRAS基因变异测定的大肠癌再发风险的高低判
断。

未被输入“必要2组分类”之时,程序向步骤S1-18进行,向输出
部305发送显示被检者的大肠癌再发风险为中度的判断结果。

另一方面,2组分类是必要时,程序向步骤S1-19进行。在步骤
S1-19中,对于判断为中风险的待测样品,进行基于KRAS基因的变
异的有无的大肠癌再发风险的高低判断的处理。在此处理中使用变异
测定装置4。

在步骤S1-19中,接收部301取得判断为中风险的被检者的KRAS
基因的序列太阳城集团。接下来,在步骤S1-20中,判断部304比较取得的
KRAS基因的序列和存储部302中存储的KRAS基因的非变异序列,
判断在被检者的活体样品中的KRAS基因中有变异与否。在KRAS
基因有变异时,程序向步骤S1-21进行,判断部304向输出部305发
送显示被检者的大肠癌再发风险高(高风险)的判断结果。另一方面,
在KRAS基因上无变异时,程序向步骤S1-22进行,判断部304向输
出部305发送显示被检者的大肠癌再发风险低(低风险)的判断结果。

然后,在步骤S1-23中,输出部305输出被检者的大肠癌再发风
险的判断结果,表示于显示部3c。由此,诊断辅助装置1可给医师等
提供辅助对于被检者的大肠癌的再发风险是高,中度,或者低进行判
断的太阳城集团。

在本发明中也含对于被检者的大肠癌再发风险的判断适宜的系
统。

再有,存储部302记录用于在计算机系统3中实行以下的工序的
计算机程序的:

接收从大肠癌患者采集的活体样品中的自第18染色体长链上的
18q21~18q23的区域中存在的第1基因组选择的多个基因的表达量,
接收自第20染色体长链上的20q11~20q13的区域中存在的第2基因
组选择的多个基因的表达量,以及,接收自含ANGPTL2、AXL、C1R、
C1S、CALHM2、CTSK、DCN、EMP3、GREM1、ITGAV、KLHL5、
MMP2、RAB34、SELM、SRGAP2P1及VIM的第3基因组选择的多
个基因的表达量的工序;

基于接收的表达量,判断上述患者的大肠癌的再发风险的工序。

本实施方式的方法基于上述的解析工序中得到的解析结果,判断
被检者的大肠癌再发风险。可提供例如,被检者的大肠癌再发的可能
性高,那样的可能性为中度,或者那样的可能性低的判断结果。通过
向医师等提供上述的判断结果,辅助医师等诊断对大肠癌的再发可能
性。

【实施例】

【实施例1:根据大肠癌患者的预后的分类的探讨】

〈方法〉

在Affymetrix公司GeneChip,人基因组U133+2.0阵列的数据
组GSE14333(NCBIGeneExpressionOmnibus(URL;获自
http://www.ncbi.nlm.nih.gov/geo/))之中,将大肠癌(结肠癌)患者
72病例作为训练组使用。作为解析软件,使用阵列数据解析用软件
(ExpressionConsolev1.1(Affymetrix公司制))、表计算用软件
(OfficeExcel2002,2007(Microsoft公司制))、聚类分析用软件
(Cluster3.0,Java(注册商标)Treeview(获得处;
http://bonsai.hgc.jp/~mdehoon/software/cluster/software.htm))、统
计解析软件(MedCalc(MedCalc公司制))进行各种解析。

在数据的标准化中使用MAS5。在GeneChip上的全探针之中,
将基因符号不明的探针及表达平均的信号值不足300的探针自解析除
外。对于对应的基因重复的探针,以表达平均的信号值最大的探针作
为代表,其余除外。将信号值Z变换后,用最接近距离法进行无教师
阶层聚类。类似性尺度作为Pearson相关系数。

从聚类分析的结果,将推定为满足(1)反映重要的生物学功能的,
(2)贡献于特征性的病例聚类的生成的2条件的基因聚类作为功能模
块定义-提取,通过重复进行由功能模块的组合的聚类进行再发风险
组分类法的构建。

〈结果〉

在图5中显示训练组的病例中的再发风险组分类的结果。以下,
基于全患者病例中的基因的表达量的平均值,作为判断表达量的增减
的值。例如,在某基因的表达量是上述的平均值以上时,判断为相对
表达量增加,在相比上述的平均值更小时,判断为相对的表达量减少。
如图5所示,从训练组提取显示第18染色体长链上的基因组(以下,
有时记作“第1基因组”或“18qLoss模块”)的相对的表达量减少、及
第20染色体长链上的基因组(以下,有时记作“第2基因组”或“20q
Amp模块”)的相对的表达量增加的病例,将其定义为B型。从训练
组提取18qLoss模块及20qAmp模块的表达模式与B型相反的病例,
将其定义为A型。另外,在训练组中,由于与A型及B型中的基因
的表达量无关系,出现以间质关联基因组的强表达作为特征的病例,
定义为独立于这些的病例的C型。构成使用的3功能模块的基因示于
表1。

【表1】



在表2中如上述一样显示分类的每类型的病例数(存在比率)及
大肠癌的再发率。

【表2】



存在比率
再发率
A型
30.6%(22)
4.5%(1)
B型
33.3%(24)
12.5%(3)
C型
36.1%(26)
23.1%(6)

100%(72)
13.9%(10)

全72个病例之中,分类为A型的病例是22病例、分类为B型的
病例是24病例、分类为C型的病例是26病例。大肠癌的再发率是,
在A型中是4.5%、在B型中是12.5%、在C型中是23.1%。

在图6中显示在分类的每类型制成的Kaplan-Meier曲线。如图6
所示,知在各类型中的手术后的无再发生存率上确认大的差异。

从示于表2及图6的结果知,可将A型定义为再发风险低的低风
险组、将B型定义为再发风险中度的中风险组、将C型定义为再发风
险高的高风险组。以下,有时将低风险组、中风险组、及高风险组总
称而记作再发风险组。

【实施例2:再发风险组分类的信赖性的验证1】

〈方法〉

在Affymetrix公司GeneChip,人基因组U133+2.0阵列的数据
组GSE14333(NCBIGeneExpressionOmnibus(URL;获自
http://www.ncbi.nlm.nih.gov/geo/))之中,将在训练组不使用的患者
74病例作为验证组1使用。再有,按照成用与训练组的病例和验证组
1的病例各自不同的医疗设施取得的待测样品地选择。

对于向训练组的72病例加验证组1的74病例的146病例,与实
施例1同样地,使用表1的基因进行聚类。

〈结果〉

在图7中显示训练组及验证组1的病例中的再发风险组分类的结
果。如图7所示知,虽然在训练组和验证组1中取得活体样品的设施
不同,但不形成设施的差异来源的聚类,全病例被分类为3个再发风
险组之任一个。

【实施例3:再发风险组分类的信赖性的验证2】

〈方法〉

将对大肠癌(结肠癌)患者53病例的Affymetrix公司GeneChip,
人基因组U133+2.0阵列的数据组GSE18088(NCBIGeneExpression
Omnibus(URL;获自http://www.ncbi.nlm.nih.gov/geo/)作为验证组
2使用。对于此53病例,与实施例1同样地,使用表1的基因进行聚
类。

〈结果〉

在图8中显示验证组2的病例中的再发风险组分类的结果。如图
8所示知,虽然验证组2与训练组在取得活体样品的设施及进行
GeneChip测定的设施上不同,但验证组2中的全病例被分类为3个
再发风险组之任一个。

在表3中,如上述一样显示分类的每类型的病例数(存在比率)
及大肠癌的再发率。

【表3】



存在比率
再发率
低风险组
43.4%(23)
8.7%(2)
中风险组
47.2%(25)
28.0%(7)
高风险组
9.4%(5)
80.0%(4)
合计
100%(53)
24.5%(13)

在全部53个病例之中,分类为低风险组的病例是23病例、分类
为中风险组的病例是25病例、分类为高风险组的病例是5病例。大肠
癌的再发率是,在低风险组中是8.7%、在中风险组中是28.0%、在高
风险组中是80.0%。从表3的结果知,虽然验证组2与训练组在取得
活体样品的设施及进行GeneChip测定的设施上不同,但各再发风险
组不受设施的差异的影响,显示与实施例1同样的结果。

【实施例4:再发风险组分类的信赖性的验证3】

〈方法〉

将对大肠癌(结肠癌)患者258病例的Affymetrix公司GeneChip,
人基因组U133+2.0阵列的数据组GSE39582(NCBIGeneExpression
Omnibus(URL;获自http://www.ncbi.nlm.nih.gov/geo/)作为验证组
3使用。对于此256病例,与实施例1同样地,使用表1的基因进行
聚类。

〈结果〉

在图9中显示验证组3的病例中的再发风险组分类的结果。如图
9所示知,虽然验证组3与训练组在取得活体样品的设施及进行
GeneChip测定的设施上不同,但验证组3中的全病例被分类为3个
再发风险组之任一个。

在表4中,如上述一样显示分类的每类型的病例数(存在比率)
及大肠癌的再发率。

【表4】



存在比率
再发率
低风险组
28.7%(74)
12.2%(9)
中风险组
47.7%(123)
23.6%(29)
高风险组
23.6%(61)
39.3%(24)

100%(258)
24.0%(62)

在全部258病例之中,分类为低风险组的病例是74病例、分类为
中风险组的病例是123病例、分类为高风险组的病例是61病例。大肠
癌的再发率是,在低风险组中是12.2%、在中风险组中是23.6%、在
高风险组中是39.3%。

在图10中显示在分类的每类型制成的Kaplan-Meier曲线。如图
10所示知,在各类型中的手术后的无再发生存率上确认大的差异。

从表4及图10的结果知,虽然验证组3与训练组在取得活体样品
的设施及进行GeneChip测定的设施上不同,但各再发风险组不受设
施的差异的影响,显示与实施例1同样的结果。

【实施例5:再发风险组分类的信赖性的验证4】

作为验证组4,从大肠癌(结肠癌)患者85病例采集组织,冷冻
保存。使用此冷冻保存组织85个待测样品,用Affymetrix公司
GeneChip、人基因组U133+2.0阵列进行表达解析。对于此85个待
测样品,与实施例1同样地,使用表1的基因进行聚类。

〈结果〉

在图11中显示验证组4的病例中的再发风险组分类的结果。如图
11所示知,虽然验证组4与训练组在取得活体样品的设施及进行
GeneChip测定的设施上不同,但验证组4中的全病例被分类为3个
再发风险组之任一个。

在表5中,如上述一样显示分类的每类型的病例数(存在比率)
及大肠癌的再发率。

【表5】



存在比率
再发率
低风险组
27.1%(23)
0%(0)
中风险组
30.6%(26)
11.5%(3)
高风险组
42.3%(36)
22.2%(8)

100%(85)
12.9%(11)

在全部85个病例之中,分类为低风险组的病例是23病例、分类
为中风险组的病例是26病例、分类为高风险组的病例是36病例。大
肠癌的再发率是,在低风险组中是0%、在中风险组中是11.5%、在
高风险组中是22.2%。

在图12中显示在分类的每类型制成的Kaplan-Meier曲线。如图
12所示知,在各类型中的手术后的无再发生存率上确认大的差异。

从表5的结果知,在验证组4中也显示与实施例1同样的结果。

如上所述,由功能模块解析,可将大肠癌的病例分类为3个再发
风险组。各自的再发风险组有不同的再发风险。另外,从实施例1~5
的结果知,再发风险组的分类是不受数据组的获得处的影响的信赖性
高的分类法。从而示,由使用本实施方式的大肠癌的再发风险组分类
的再发风险的诊断辅助方法,充分地得到稳定的信赖性高的结果。

【比较例:由以往方法(Dukes分类)的预后预测】

作为预后预测性能的比较对照,对于训练组的72病例进行由
Dukes分类的生存太阳城集团解析的结果示于图13。在图13中,DukesA表
示癌停留在大肠壁内的状态,DukesB表示癌贯穿大肠壁、但无淋巴
节转移的状态,DukesC表示有淋巴节转移的状态。

如示于图2及图13,相比由本实施方式的诊断辅助方法判断为高
风险的病例是26病例,由比较例的判断方法判断为高风险(DukesC)
的病例是15病例。另外,相比在由比较例的判断方法判断为DukesA
的病例和判断为DukesB的病例的无再发生存率上几乎无差异,在由
本实施方式的诊断辅助方法判断为低风险组的病例和判断为中风险组
的病例的无再发生存率上确认差异。从结果提示,由本实施方式的再
发风险诊断辅助方法可相比以往的病理学分类更精确判断再发风险。

【实施例6:通过由KRAS基因变异的中风险组的分级的预后预
测性能的升高1】

用实施例4中进行的解析结果将全待测样品分为2组:将作为中
风险组的待测样品之中有KRAS基因变异的待测样品作为高风险、将
无KRAS基因变异的待测样品作为低风险,(参照图14)。具体而言,
如下述一样测定待测样品的DNA中的KRAS变异的有无,基于结果
将全待测样品分为2组。

首先,制备有以下的表6的组成的PCRmasterMix。

【表6】



体积(5管分)
10×Ex Tag缓冲剂
10μl
dNTP(2.5mM)
8μl
TaKaRa Ex Tag HS(1单位/μl)
2μl
正向引物(10μM)
2μl
反向引物(10μM)
2μl
总体积
24μl

接下来,将基因组DNA10ng分注到0.5mlPCR管,添加无核酶
水至成全量20μL。然后,以4.8μl/管添加PCRmasterMix,混合。
再有,向PCRMasterMix加的引物是示于以下的表7的引物。在含
KRAS基因的外显子2的第12及13密码子的区域的扩增中使用SEQ
IDNO:57及58的引物对,在含外显子3的第61密码子的区域的扩
增中使用SEQIDNO:59及60的引物对。

【表7】

引物名
碱基序列
序列编号
KRAS外显子2正向引物
CGATACACGT CTGCAGTCAA C
57
KRAS外显子2反向引物
ACCCTGACAT ACTCCCAAGG
58
KRAS外显子3正向引物
AGGTGCTTAG TGGCCATTTG
59
KRAS外显子3反向引物
TGCATGGCAT TAGCAAAGAC
60

将得到的PCRmasterMix设置到热循环仪而实施以下的程序,
KRAS的外显子2序列及外显子3序列由PCR扩增。KRAS外显子2
是:95℃:10分钟→(94℃:1分钟→55℃:1分钟→72℃:1分钟)×38
个循环→72℃:10分钟→4℃保持KRAS外显子3是:95℃:10分钟→
(94℃:1分钟→63℃:1分钟→72℃:1分钟)×38个循环→72℃:10分
钟→4℃保持

扩增后,进行1%琼脂糖凝胶电泳,确认是单一条带。其后,向
0.5mlPCR管分注PCR产物5μl,加2μl的ExoSAP-IT而进行混合,
设置到热循环仪,实施以下的程序。37℃15分钟→80℃15分钟→4℃
保持

向产物2μl添加9.6μl的1pmol/μl的引物(F或R)、9.4μl的
NFW而进行混合。测序解析委托Operon公司进行。比较作为解析对
象的碱基序列和SEQIDNO:1的碱基序列,用1个也可确认变异时,
作为KRAS基因上有变异。对于在实施例4中判断为中风险组的待测
样品,将KRAS基因见到变异的待测样品分类为高风险组,将KRAS
基因未见到变异的待测样品分类为低风险组。

将结果在图14中显示各组的Kaplan-Meier曲线。比较图14和图
10知,将KRAS基因变异的有无加到判断基准,可将中风险组的病例
分类为在无再发生存率上确认大的差异的高低2个风险组。

【实施例7:通过由KRAS基因变异的中风险组的分级的预后预
测性能的升高2】

用在实施例5中进行的解析结果将全待测样品分为2组,将作为
中风险组的待测样品之中有KRAS基因变异的待测样品作为高风险、
将无KRAS基因变异的待测样品作为低风险。

将结果在图15中显示各组的Kaplan-Meier曲线。比较图15和图
12知,通过将KRAS基因变异的有无加到判断基准,可将中风险组的
病例分类为在无再发生存率上确认大的差异的高低2个风险组。

【实施例8:使用福尔马林固定石蜡包埋(FFPE)组织的验证】

在实施例5中使用的冷冻保存组织待测样品85病例之中,从18
病例制备FFPE组织待测样品。使用此18个待测样品进行再发风险组
分类。更具体而言,首先,使用RNAeasyFFPE试剂盒(QIAGEN公
司),从FFPE组织待测样品提取总RNA。使用SensationPlusFFPE
扩增及3’IVT标记试剂盒(Affymetrix公司)进行核酸芯片预处理。
使用上述得到的总RNA进行GeneChip测定。与实施例1同样地,对
于表1的基因进行聚类。

在图16中显示对于上述FFPE组织待测样品18待测样品得到的
再发风险组分类的结果。如图16所示知,在使用FFPE组织待测样品
时,也可基于表1的基因的表达量,将大肠癌的病例分类为3个再发
风险组。在表8中显示对于FFPE组织待测样品18病例分类的每类型
的病例数(存在比率)及大肠癌的再发率。

【表8】



存在比率
再发率
低风险组
22.2%(4)
0%(0)
中风险组
33.3%(6)
0%(0)
高风险组
44.4%(8)
37.5%(3)
合计
100%(18)
16.7%(3)

在全部18病例之中,分类为低风险组的病例是4病例、分类为中
风险组的病例是6病例、分类为高风险组的病例是8病例。大肠癌的
再发率是,在低风险组中是0%、在中风险组中是0%、在高风险组中
是37.5%。这些结果显示,在使用FFPE组织待测样品时,也可对大
肠癌的病例精确进行再发风险组分类。

对于上述的FFPE组织待测样品,测定分类为中风险组的6病例
中的KRAS基因变异。结果,在全部6病例中,KRAS基因变异是阴
性,可分类为低风险组。

在图17中显示对于FFPE组织待测样品进行实施例6及7中实施
的再发风险组分类时的各组的Kaplan-Meier曲线。如图17所示知,
使用FFPE组织待测样品时,也在各类型中的手术后的无再发生存率
上确认大的差异。

从图16及表8的结果知,即使使用FFPE组织待测样品,也与实
施例1同样地,可对大肠癌的病例进行再发风险组分类。另外,从图
17的结果知,与实施例6及7同样地,即使使用FFPE组织待测样品,
也可基于KRAS基因变异的有无再提高再发风险组分类的精度。

在以下的表9中显示在冷冻保存组织待测样品的判断结果和在
FFPE组织待测样品的判断结果的相关表。

【表9】


一致率达83.3%,非常高,从结果也可知,在使用FFPE组织待
测样品时,也可与使用冷冻保存组织待测样品时同样、判断再发风险。

【实施例9:使用相关系数的再发风险判断方法】

在实施例1中分类的低风险组、中风险组及高风险组中,各自测
定表1所示的55个基因的表达量。基于此表达量,取得低风险组表达
模式、中风险组表达模式及高风险组表达模式。在各表达模式内,含
各基因的平均值。

作为待测样品,使用与实施例4相同的待测样品。对于各待测样
品各自测定表1所示的55个基因的表达量。基于此表达量,取得各待
测样品的表达模式。

基于Spearman的次序相关算出待测样品的表达模式和各风险组
的表达模式之间的相关系数。对于各待测样品特别指定显示最高的相
关系数的风险组。

实施例4的结果(由聚类解析的风险分类)和实施例9的结果的
一致率示于表10。

【表10】


如表10所示,实施例9的结果和实施例4的结果的一致率是83%。
从结果知,使用相关系数时也可判断待测样品的再发风险。

【实施例10:使用KRAS基因变异的再发风险判断】

检测在实施例9中再发风险被判断为中度的患者组的KRAS基因
变异的有无。在中风险组之中,将有KRAS基因变异的待测样品分类
为再发风险高、将无KRAS基因变异的待测样品分类为再发风险低。

实施例6的结果和实施例10的结果的一致率示于表11。

【表11】


如表11所示,实施例10的结果和实施例6的结果的一致率是
85%。从结果知,使用相关系数时也可判断待测样品的再发风险。

另外,在图18中显示由实施例10的结果制成的Kaplan-Meier
曲线。如图18所示,将KRAS基因变异的有无加到判断基准,可将
各待测样品分类为无再发生存率的不一样大的高低2个风险组。

在算出相关系数而判断再发风险时,也可使用图1所示的诊断辅
助装置。基于图19说明此时的处理流程。再有,此装置的存储部预先
存储高风险组表达模式、中风险组表达模式及低风险组表达模式。

在步骤S2-1中,诊断辅助装置1的受诊部301从测定装置2取得
显示活体样品中的各基因的表达量的荧光太阳城集团。接下来,在步骤S2-2
中,算出部303从取得的太阳城集团算出荧光强度,向存储部302发送。然
后,在步骤S2-3中,算出部303基于存储的荧光强度,算出各基因的
表达量(其中,取得活体样品的表达模式)。其后,在步骤S2-4中,
判断部304读取存储部302中存储的高风险组表达模式、中风险组表
达模式及低风险组表达模式,基于这些和在步骤S2-3中取得的活体样
品的表达模式,算出活体样品的表达模式和高风险组表达模式的相关
系数(以下也称为“相关系数H”)、活体样品的表达模式和中风险组
表达模式的相关系数(以下也称为“相关系数M”)、及活体样品的表
达模式和低风险组表达模式的相关系数(以下也称为“相关系数L”)。

在步骤S2-5中,判断相关系数H最高与否。即,相关系数H相
比相关系数M更高,相关系数H相比相关系数L更高时,相关系数
H被判断为最高。相关系数H最高时,在步骤S2-6中,活体样品被
分类为高风险组,判断为活体样品的再发风险高。

在步骤S2-5中,判断为相关系数H不是最高的相关系数时,在
步骤S2-7中,判断相关系数M最高与否。即,相关系数M相比相关
系数H更高,相关系数M相比相关系数L更高时,判断为相关系数
M最高。相关系数M最高时,在步骤S2-8中活体样品被分类为中风
险组,判断为活体样品的再发风险为中度。

在步骤S2-7中,判断为相关系数M不是最高的相关系数的时,
在步骤S2-9中,判断为相关系数L最高。关系数L最高时,在步骤
S2-9中活体样品被分类为低风险组,判断为活体样品的再发风险低。

在步骤S2-10中,输出部305输出被检者的大肠癌再发风险的判
断结果,表示于显示部3c。由此,诊断辅助装置1可给医师等提供辅
助对于被检者的大肠癌的再发风险高,中度,或者低的判断的太阳城集团。

另外,在图19的流程图中,也可代替判断相关系数M最高与否
的步骤而含判断相关系数L最高与否的步骤。另外,也可代替判断相
关系数H最高与否的步骤而含判断相关系数L最高与否的步骤。均可
判断相关系数H,M及L之任何最高。在任何的情况中,不限定判断
步骤的实行顺序。

【符号说明】

1
诊断辅助装置
2
测定装置
3
计算机系统
3a
计算机本体
3b
输入部
3c
显示部
4
变异测定装置
30
CPU
31
ROM
32
RAM
33
硬盘
34
输入输出界面
35
读取装置
36
通信接口
37
图像输出界面
38
总线
40
记录介质
301
接收部
302
存储部
303
算出部
304
判断部
305
输出部


















































































































































































关 键 词:
辅助 肠癌 再发 风险 诊断 计算机系统 程序 方法
  专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
太阳城集团本文
本文标题:辅助大肠癌的再发风险诊断的计算机系统、程序及方法.pdf
链接地址:http://zh228.com/p-6409474.html
太阳城集团我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备17046363号-1 
 


收起
展开
葡京赌场|welcome document.write ('');