
ížˆìŠ¤í†¤ì€ ì§„í•µì„¸í¬ì˜ 핵 ë‚´ì—서 DNA와 결합하여 í¬ë¡œë§ˆí‹´(chromatin)ì„ êµ¬ì„±í•˜ëŠ” 구조 단백질ì´ë‹¤(Wolffe and Guschin, 2000; Cutter and Hayes, 2015). 4ì¢…ë¥˜ì˜ ížˆìŠ¤í†¤ 단백질(H2A, H2B, H3, H4)ì€ 2개씩 결합하여 히스톤 팔량체(histone octamer)를 ì´ë£¨ë©°, ì´ íŒ”ëŸ‰ì²´ëŠ” 약 146 bpì˜ DNAì— ê°ê²¨ í¬ë¡œë§ˆí‹´ì˜ 구조ì 기본 ë‹¨ìœ„ì²´ì¸ ë‰´í´ë ˆì˜¤ì¢€(nucleosome)ì„ í˜•ì„±í•œë‹¤. ì´ ë•Œ, 히스톤과 DNA 사ì´ì˜ ì •ì „ê¸°ì ì¸ ì¸ë ¥ì´ 뉴í´ë ˆì˜¤ì¢€ì„ 형성하는 기본 ì›ë¦¬ì´ë©°, ì´ë¥¼ 바탕으로 긴 DNA ê°€ë‹¥ì„ ì²´ê³„ì 으로 ì‘축하여 í¬ë¡œë§ˆí‹´ 구조를 ë§Œë“ ë‹¤. 하지만 ì „ì‚¬ì¸ìž(transcription factor)나 RNA 중합효소(polymerase) 입장ì—서 ë³´ë©´ 뉴í´ë ˆì˜¤ì¢€ì€ ì´ ë‹¨ë°±ì§ˆë“¤ì´ DNAì— ê²°í•©í•˜ëŠ” ê²ƒì„ ë§‰ëŠ” ìž¥ì• ë¬¼ì´ë‹¤. ì´ë¥¼ 해결하기 위해 DNA와 히스톤 사ì´ì˜ ê²°í•©ì„ ì•½í™”ì‹œí‚¤ëŠ” ë°©ë²•ì´ ì¡´ìž¬í•˜ëŠ”ë°, 히스톤 ë‹¨ë°±ì§ˆì˜ í™”í•™ì ë³€í˜•ì´ ì¤‘ìš”í•œ ë¶€ë¶„ì„ ë‹´ë‹¹í•œë‹¤.
히스톤 ë‹¨ë°±ì§ˆì˜ N-ë§ë‹¨ 아미노산ì—는 아세틸기나 메틸기 ê°™ì€ í™”í•™ ê·¸ë£¹ì´ ê°€ì—ì 으로 ê²°í•©í• ìˆ˜ 있는ë°, ì´ í™”í•™ì ë³€í˜•ë“¤ì„ ížˆìŠ¤í†¤ 변형(histone modifications)ì´ë¼ ì¼ì»«ëŠ”ë‹¤(Bannister and Kouzarides, 2011). 히스톤 ë³€í˜•ì€ ì•„ë¯¸ë…¸ì‚°ì˜ ìœ„ì¹˜ì™€ 결합하는 화학 ê·¸ë£¹ì˜ ì¢…ë¥˜ì— ë”°ë¼ ë‹¤ì–‘í•˜ë©°, ì§ì ‘ì 으로 í¬ë¡œë§ˆí‹´ 구조를 변화시키거나 구조를 변화시키는 ë‹¨ë°±ì§ˆì„ ëª¨ì§‘í•˜ëŠ”ë°(recruit) 관여한다. 아세틸화(acetylation)와 메틸화(methylation)는 대표ì ì¸ ížˆìŠ¤í†¤ 변형으로 주로 ë¦¬ì‹ (lysine, K) 잔기ì—서 ì¼ì–´ë‚œë‹¤. ì•„ì„¸í‹¸í™”ì˜ ê²½ìš°, 히스톤 ë‹¨ë°±ì§ˆì˜ ì–‘ì „í•˜ë¥¼ ê°ì†Œì‹œí‚¤ë©°, ê·¸ ê²°ê³¼ DNAì™€ì˜ ê²°í•©ì„ ì•½í™”ì‹œì¼œ í¬ë¡œë§ˆí‹´ 구조를 활성화시킨다. ì´ì— 반해 메틸화는 ë³€í˜•ì´ ì¼ì–´ë‚˜ëŠ” ì•„ë¯¸ë…¸ì‚°ì˜ ìœ„ì¹˜ì— ë”°ë¼ ê·¸ ì—í• ì´ ë‹¤ë¥´ë‹¤. 히스톤 H3ì˜ 4번 ë¦¬ì‹ ì˜ 3-메틸화(H3K4me3)는 ì „ì‚¬ê°€ 활발히 ì¼ì–´ë‚˜ëŠ” 프로모터(promoter)ì—서 ì „ì‚¬ì¸ìžì˜ ëª¨ì§‘ì„ ë„와주지만(Vermeulen et al., 2007; Lauberth et al., 2013), H3K27me3는 í¬ë¡œë§ˆí‹´ 구조를 불활성화시키는 ë‹¨ë°±ì§ˆì„ ë¶ˆëŸ¬ë“¤ì—¬ ìœ ì „ìž ì „ì‚¬ ì–µì œì— ê¸°ì—¬í•œë‹¤(Cao et al., 2002; Min et al., 2003). 특히 히스톤 H3K27ac와 H3K27me3는 ê°™ì€ ì•„ë¯¸ë…¸ì‚°ì—서 ì¼ì–´ë‚˜ì§€ë§Œ í¬ë¡œë§ˆí‹´ êµ¬ì¡°ì— ë¯¸ì¹˜ëŠ” ì˜í–¥ì´ ìƒë°˜ë˜ê¸° ë•Œë¬¸ì— ì´ë“¤ ë³€í˜•ì— ëŒ€í•œ ë§Žì€ ì—°êµ¬ë“¤ì´ ìˆ˜í–‰ë˜ì–´ 왔다(Kim and Kim, 2011; Bowman et al., 2014; Chrysanthou et al., 2022). ë˜í•œ 히스톤 ë³€í˜•ì´ ì¼ì–´ë‚˜ëŠ” ìœ ì „ì²´ ìƒì˜ 길ì´, 즉 ë¶„í¬ í˜•íƒœë„ ížˆìŠ¤í†¤ ë³€í˜•ì˜ ì¢…ë¥˜ì— ë”°ë¼ ë‹¤ë¥´ë‹¤(Landt et al., 2012). 예를 들어 H3K4me3와 H3K27ac는 ìœ ì „ìžì˜ ì „ì‚¬ì‹œìž‘ë¶€ìœ„(transcription start site) ì£¼ë³€ì˜ ì§§ì€(ì¢ì€) ì§€ì—ì—서 관찰ë˜ì§€ë§Œ, H3K9me3나 H3K27me3는 ìƒëŒ€ì 으로 긴(ë„“ì€) ì§€ì—ì— ì—°ì†ì 으로 ë¶„í¬í•˜ê³ 있다.
히스톤 ë³€í˜•ì€ ì•”ì„ í¬í•¨í•œ 다양한 질병과 ì—°ê´€ì„±ì„ ë³´ì¸ë‹¤(Chi et al., 2010; Fernandes et al., 2020). ë¹„ì •ìƒì ì¸ ížˆìŠ¤í†¤ ë³€í˜•ì€ ìœ ì „ìžì˜ ì „ì‚¬ ìƒíƒœë¥¼ 변화시킬 수 있으며, ê·¸ ê²°ê³¼ ì§ˆë³‘ì„ ì´ˆëž˜í• ìˆ˜ 있다. ì œ1형 당뇨 환ìžì™€ ê³ í˜ˆì•• ìœ ë°œ ìƒì¥ 모ë¸ì—서 H3K27ac를 í¬í•¨í•œ 히스톤 H3ì˜ ì•„ì„¸í‹¸í™” ìˆ˜ì¤€ì´ ë¹„ì •ìƒì 으로 ì¦ê°€í•˜ì˜€ìœ¼ë©°(Lee et al., 2012; Wang et al., 2019), ì „ë¦½ì„ ì•”, 위암, 췌장암ì—서는 H3K27me3 ì¦ê°€ì— ì˜í•œ ì•” ì–µì œ ìœ ì „ìžë“¤(tumor suppressor genes)ì˜ ë°œí˜„ ê°ì†Œê°€ ë³´ê³ ë˜ì—ˆë‹¤(Yu et al., 2007; Fujii and Ochiai, 2008; Ougolkov et al., 2008). ì´ëŸ¬í•œ 연구 결과를 바탕으로 히스톤 변형 효소 ìœ ì „ìžë¥¼ 표ì 으로 한 ì¹˜ë£Œì œê°€ 개발ë˜ê³ 있으며, ì‹¤ì œë¡œ 히스톤 H3K27 ë³€í˜•ì„ ë‹´ë‹¹í•˜ëŠ” enhancer of zeste homolog 2 (EZH2)와 histone deacetylase (HDAC) íš¨ì†Œì˜ ì–µì œì œê°€ í•ì•”ì œì˜ íš¨ê³¼ë¥¼ ìƒìŠ¹ì‹œí‚¨ë‹¤ëŠ” ë³´ê³ ë„ ìžˆë‹¤(Fiskus et al., 2009). ë˜í•œ ìœ ì „ì²´ ìˆ˜ì¤€ì˜ ížˆìŠ¤í†¤ 변형 연구를 통해 새로운 질병 ê´€ë ¨ ìœ ì „ìžë¥¼ ë™ì •해낼 ìˆ˜ë„ ìžˆë‹¤. 천ì‹, ì•Œì¸ í•˜ì´ë¨¸, ê°‘ìƒì„ ì•” 환ìžì˜ 세í¬ì—서 수행한 ìœ ì „ì²´ ì „ì²´ì˜ H3K27ac ë¶„í¬ ì—°êµ¬ëŠ” 새로운 질병 ê´€ë ¨ ìœ ì „ìžë¥¼ ì„ ë³„í•´ëƒˆìœ¼ë©°, ì¹˜ë£Œì œ ê°œë°œì˜ í‘œì ìœ ì „ìž í›„ë³´ë¥¼ ì œì‹œí•˜ì˜€ë‹¤(Marzi et al., 2018; McErlean et al., 2020; Zhang et al., 2021). ì´ì²˜ëŸ¼ 히스톤 ë³€í˜•ì— ëŒ€í•œ 연구 결과는 ì§ˆë³‘ì˜ ì§„ë‹¨ ë° ì˜ˆí›„ 예측, ê·¸ë¦¬ê³ ì¹˜ë£Œì œ 개발 등 다양한 분야ì—서 활용ë˜ê³ 있다.
히스톤 ë³€í˜•ì€ ì£¼ë¡œ ë©´ì—침강법(chromatin immunoprecipitation, ChIP)ì„ ì´ìš©í•˜ì—¬ 연구ëœë‹¤(Kuo and Allis, 1999). ì´ëŠ” í¬ë¦„알ë°ížˆë“œë¡œ ê³ ì •ëœ í¬ë¡œë§ˆí‹´ì„ 뉴í´ë ˆì˜¤ì¢€ 단위로 ì ˆë‹¨í•œ 후, ì›í•˜ëŠ” 히스톤 변형 í•체와 ë°˜ì‘ì‹œí‚¤ê³ , ì¹¨ì „ëœ ë‰´í´ë ˆì˜¤ì¢€ì˜ DNA를 ì •ì œí•˜ì—¬ ë¶„ì„하는 기법ì´ë‹¤. 과거ì—는 PCR 기법으로 ChIPed DNAì˜ íŠ¹ì • ë¶€ë¶„ë§Œì„ ë¶„ì„하였으나, 최근ì—는 차세대염기서열분ì„(next-generation sequencing, NGS)ì´ë¼ê³ ì¼ì»«ëŠ” 시퀀싱 ê¸°ë²•ì´ ê°œë°œë˜ì–´ ìœ ì „ì²´ ìˆ˜ì¤€ì˜ ë¶„ì„ì´ ê°€ëŠ¥í•˜ê²Œ ë˜ì—ˆë‹¤. 본 연구는 ë¶„í¬ í˜•íƒœê°€ 다른 히스톤 ë³€í˜•ë“¤ì˜ ChIP-seq ë°ì´í„°ë¥¼ ì ì ˆížˆ ë¶„ì„하기 위하여, H3K27ac와 H3K27me3를 대ìƒìœ¼ë¡œ NGS ë°ì´í„° peak ì„ ë³„ 프로그램들(MACS2와 SICER)ì„ ë¹„êµí•˜ì˜€ìœ¼ë©°, ì´ë“¤ ë°©ë²•ì˜ ì ì ˆì„±ì„ peak로 ì„ ë³„ë˜ì§€ ì•Šì€ ë¶€ë¶„ê³¼ 비êµí•˜ì—¬ ê²€ì¦í•˜ì˜€ë‹¤. ë˜í•œ ChIP-seq ë°ì´í„°ë¥¼ 다양한 용량(read 수)ì—서 ë¶„ì„하여 히스톤 변형 ë¶„í¬ í˜•íƒœì— ë”°ë¥¸ ChIP-seq ë°ì´í„°ì˜ 질ì 수준과 시퀀싱 용량(sequencing depth) 사ì´ì˜ ìƒê´€ê´€ê³„를 조사하였다.
사람 ì 혈구 ìœ ëž˜ 세í¬ì£¼ K562ì˜ H3K27ac와 H3K27me3 ChIP-seq raw fastq 파ì¼ì€ GEO databaseì—서 확보하였으며(H3K27ac, GSE66023; H3K27me3, GSE167869), Galaxy 플랫í¼ì„ ì´ìš©í•˜ì—¬ ë¶„ì„하였다(https://usegalaxy.org). ì—¼ê¸°ì„œì—´ì˜ ì •í™•ë„ê°€ ë‚®ì€ reads는 Filter by quality와 FASTQ Quality Trimmerë¼ëŠ” ë¶„ì„ ë„구를 ì´ìš©í•˜ì—¬ ì œê±°í•˜ì˜€ê³ , 질ì 수준(quality)ì´ ë³´ì •ëœ reads를 Bowtie2를 ì´ìš©í•˜ì—¬ 사람 hg19 canonical reference genomeì— ì •ë ¬(alignment, mapping)하였다(Langmead and Salzberg, 2012). Reads를 ì •ë ¬í•œ bam 파ì¼ì—서 mapping quality (MAPQ)ê°€ 20 미만ì´ê±°ë‚˜ PCR duplicate로 ì¶”ì •ë˜ëŠ” reads를 ì œê±°í•˜ì—¬ ì •í™•ížˆ ì •ë ¬ëœ readsë§Œì„ ì´í›„ ë¶„ì„ì— ì‚¬ìš©í•˜ì˜€ë‹¤. ChIP-seq ë°ì´í„°ë¥¼ 시ê°í™”하기 위해 BamCoverage를 ì´ìš©í•˜ì—¬ bigwig 파ì¼ì„ ìƒì„±í•˜ì˜€ìœ¼ë©°(Ramírez et al., 2016), H3K27ac와 H3K27me3ì˜ ë¶„í¬ëŠ” Integrative genomics viewer (IGV)ì—서 관찰하였다(Thorvaldsdóttir et al., 2013). UCSC databaseì—서 ì œê³µí•˜ëŠ” 사람 ìœ ì „ìžì— 대한 bed 파ì¼ì„ 기준으로 ì „ì‚¬ì‹œìž‘ë¶€ìœ„ ì£¼ë³€ì˜ H3K27ac와 H3K27me3 ë¶„í¬ ìˆ˜ì¤€ì„ deeptoolsì˜ computeMatrix로 ë¶„ì„í•˜ê³ plotHeatmap으로 나타내었다.
H3K27ac와 H3K27me3ê°€ ë§Žì´ ê´€ì°°ë˜ëŠ” ì§€ì—(peak)ì„ ì„ ë³„í•˜ê¸° 위해 ì´ ì„¸ 가지 ë¶„ì„ ë°©ë²•ì„ ì‚¬ìš©í•˜ì˜€ë‹¤. 첫 번째로 MACS2ì—서 default parameter로 ë‘ ë³€í˜•ì˜ narrow peak를 ì„ ë³„í•˜ì˜€ê³ , ë™ì¼í•œ bam 파ì¼ì—서 MACS2ì˜ broad optionì„ ì‚¬ìš©í•˜ì—¬ ë°ì´í„°ë¥¼ ë¶„ì„하였다(Zhang et al., 2008). 마지막으로 SICERì—서 default parameter를 ì´ìš©í•˜ì—¬ peak를 ì„ ë³„í•˜ê³ ë¹„êµí•˜ì˜€ìœ¼ë©°(Zang et al., 2009), SICER로 ë¶„ì„하기 위해 bam 파ì¼ì„ bed 파ì¼ë¡œ 변환하여 사용하였다. ëª¨ë“ peak ì„ ë³„ ê³¼ì •ì—서 ChIP ì‹¤í—˜ì— ëŒ€í•œ input ChIP-seq ë°ì´í„°ë¥¼ control로 사용하였다.
Peak ì„ ë³„ ë°©ë²•ì˜ ì ì ˆì„±ì„ íŒë‹¨í•˜ê¸° 위해 signal-to-background ratio를 비êµí•˜ì˜€ë‹¤. 세 가지 ë¶„ì„ ë°©ë²•ì— ì˜í•´ ì„ ë³„ëœ peaks를 기준으로 히스톤 ë³€í˜•ì´ ì¼ì–´ë‚˜ì§€ 않는 ì§€ì—(non-peak regions)ì„ ComplementBed로 ì§€ì •í•˜ì˜€ë‹¤. Peaks와 non-peak regionsì— ì •ë ¬ëœ read 수를 ì¸¡ì •í•˜ì—¬ counts per million (CPM) ê°’ì„ ê³„ì‚°í•˜ì˜€ìœ¼ë©°(CPM=(íŠ¹ì • ì§€ì—ì˜ read 수)/((ì „ì²´ read 수)/106)), ì´ ë•Œ ì „ì²´ read 수는 flagstatì„ ì´ìš©í•˜ì—¬ ì¸¡ì •í•˜ì˜€ë‹¤. ê·¸ë¦¬ê³ Peaksì˜ í‰ê· CPM ê°’ì„ non-peak regionsì˜ í‰ê· CPM 값으로 ë‚˜ëˆ”ìœ¼ë¡œì¨ signal-to-background ratio를 ë„출하였다.
본 ì‹¤í—˜ì— ì‚¬ìš©í•œ K562 세í¬ì£¼ëŠ” ATCCì—서 구입하였으며, 배지는 Gibcoì—서 구입한 시약들로 ì œìž‘í•˜ì˜€ë‹¤. 사용한 배지는 10% FBS, 1% Penicillin/Streptomycin, 2 mM L-Glutamine, 20 mM HEPESê°€ í¬í•¨ëœ RPMI 1640ì´ì—ˆìœ¼ë©°, 세í¬ëŠ” 37℃, 5% CO2 ì¡°ê±´ì—서 ë°°ì–‘ë˜ì—ˆë‹¤.
ChIP ì‹¤í—˜ì€ ë‹¤ìŒê³¼ ê°™ì´ ìˆ˜í–‰í•˜ì˜€ë‹¤(Kuo and Allis, 1999). K562 (1×107) 세í¬ë¥¼ 1% formaldehyde (Sigma) ì¡°ê±´ì—서 10ë¶„ê°„ 처리한(crosslinking) 후, 0.125 M Glycine (Invitrogen) 조건으로 ë°˜ì‘ì„ ì¤‘ë‹¨í•˜ì˜€ë‹¤. Cell lysis buffer를 ì²˜ë¦¬í•˜ê³ 10ë¶„ê°„ ì–¼ìŒì—서 ë°˜ì‘한 후, ì›ì‹¬ë¶„리를 통해 í•µì„ ë¶„ë¦¬í•˜ì˜€ìœ¼ë©°, 분리한 í•µì— MNase (Worthington Biochemical Corp)를 37℃, 15ë¶„ê°„ 처리하여 í¬ë¡œë§ˆí‹´ì„ ë‹¨ì¼ ë‰´í´ë ˆì˜¤ì¢€ 수준으로 ì ˆë‹¨í•˜ì˜€ë‹¤. í•µì„ ë¶„í•´í•œ 후, ì ˆë‹¨ëœ í¬ë¡œë§ˆí‹´ì„ Protein A agarose beads (Millipore)와 ë°˜ì‘시켜(4℃, overnight) ë©´ì—침강 ì „ì— beadsì— ë¹„íŠ¹ì´ì 으로 결합하는 í¬ë¡œë§ˆí‹´ì„ ì œê±°í•˜ì˜€ë‹¤(preclearing). ì´í›„, 히스톤 H3K27ac ë˜ëŠ” H3K27me3ì— íŠ¹ì´ì ì¸ í•체와 ë°˜ì‘ì‹œí‚¤ê³ (4℃, 3시간), Protein A agarose beads를 ì´ìš©í•˜ì—¬ í•ì²´ì— ê²°í•©í•œ í¬ë¡œë§ˆí‹´ì„ ì„ ë³„ 분리하였다. ë으로 phenol extraction ê¸°ë²•ì„ ì´ìš©í•˜ì—¬ DNA를 분리 ì •ì œí•˜ì˜€ë‹¤. ChIP ì‹¤í—˜ì— ì‚¬ìš©í•œ í•체는 Abcamê³¼ Milliporeì—서 구입하였다(H3K27ac, ab4729; H3K27me3, 07-449).
ChIP-seq ë¼ì´ë¸ŒëŸ¬ë¦¬ëŠ” NEBNext Ultra II DNA Library Prep Kit (New England Biolabs)를 ì´ìš©í•˜ì—¬ ì œìž‘í•˜ì˜€ìœ¼ë©°, H3K27ac와 H3K27me3ì— ëŒ€í•œ ChIP-seq ë¼ì´ë¸ŒëŸ¬ë¦¬ ì œìž‘ì€ ë³¸ 연구실ì—서 ê¸°ì¡´ì— ìˆ˜í–‰í–ˆë˜ ì¡°ê±´ê³¼ ë™ì¼í•˜ê²Œ 진행하였다(Kang et al., 2021a; Kim et al., 2021). ChIPed DNA (H3K27ac, 10 ng; H3K27me3, 1 ng)ì˜ ì–‘ ë§ë‹¨ì„ 비ì 착성 ë§ë‹¨(blunt end)으로 ë§Œë“¤ê³ , 3' ë§ë‹¨ì— ì•„ë°ë‹Œì„ 추가한 후 AT base pairing으로 NEBNext Adapter를 연결하였다. Adapterê°€ ì—°ê²°ëœ DNA는 NEBNext Multiplex Oligos for Illumina (96 Unique Dual Index Primer Pairs)로 PCRì„ ìˆ˜í–‰í•˜ì—¬ ì¦íì‹œì¼°ê³ (H3K27ac, 7 cycles; H3K27me3, 11 cycles), NEBNext Sample Purification Beads로 약 175 bp 길ì´ì˜ DNA를 ì„ ë³„í•œ 후, ë¼ì´ë¸ŒëŸ¬ë¦¬ë¥¼ ì œìž‘í•˜ì˜€ë‹¤. ì œìž‘í•œ ë¼ì´ë¸ŒëŸ¬ë¦¬ì˜ ë†ë„는 Qubit dsDNA HS assay kit (Invitrogen)로 ì¸¡ì •í•˜ì˜€ìœ¼ë©°, NGS ì‹œí€€ì‹±ì€ NovaSeq 6000ì—서 100 bp paired-end 조건으로 수행하여 약 6천만개(60 M)ì˜ reads를 얻었다.
Paired-end ì‹œí€€ì‹±ì„ í†µí•´ ì–»ì€ H3K27ac와 H3K27me3 ChIP-seq ë°ì´í„° ë¶„ì„ì€ ë³¸ 연구실ì—서 ê¸°ì¡´ì— ìˆ˜í–‰í•˜ë˜ ë¶„ì„ ê³¼ì •ê³¼ ë™ì¼í•˜ê²Œ 진행하였으며(Kim et al., 2020; Kang et al., 2021b; Kang et al., 2021c), single-end 시퀀싱으로 ì–»ì€ public ë°ì´í„° ë¶„ì„ ë°©ë²•ì„ ì¼ë¶€ ìˆ˜ì •í•˜ì˜€ë‹¤. Fastq 파ì¼ì˜ quality는 FastQC로 확ì¸í•˜ì˜€ê³ , read ë‚´ qualityê°€ ë‚®ì€ ì—¼ê¸°ëŠ” Trimmomatic으로 ì œê±°í•˜ì˜€ë‹¤(Bolger et al., 2014). Quality를 ë³´ì •í•œ reads는 hg19 canonical reference genomeì— Bowtie2로 ì •ë ¬í•˜ì˜€ê³ , MAPQê°€ 20 미만ì´ê±°ë‚˜ PCR duplicate로 ì˜ì‹¬ë˜ëŠ” reads는 ì œê±°í•˜ì˜€ë‹¤. ChIP-seq ë°ì´í„°ì˜ 시ê°í™”를 위해 BamCoverage를 ì´ìš©í•˜ì—¬ bigwig 파ì¼ì„ ìƒì„±í•˜ì˜€ê³ , IGV를 통해 ë³€í˜•ì˜ ë¶„í¬ë¥¼ 관찰하였다. ChIP-seq ë°ì´í„°ì˜ ì „ì²´ read 수를 ì œí•œí•˜ê¸° 위해 Downsample SAM/BAMì„ ì´ìš©í•˜ì—¬ 기존 bam 파ì¼ë¡œë¶€í„° 약 15 M, 30 M, 60 M, 120 Mì˜ readsì— í•´ë‹¹í•˜ëŠ” bam 파ì¼ì„ 새로 ìƒì„±í•˜ì˜€ìœ¼ë©°, ìƒì„±ëœ bam 파ì¼ì„ bigwig 파ì¼ë¡œ 변환하여 ê° ížˆìŠ¤í†¤ ë³€í˜•ì˜ ë¶„í¬ë¥¼ 관찰하였다. Read 수를 ì œí•œí•œ ë°ì´í„°ì—서 H3K27ac와 H3K27me3ì˜ peak는 MACS2 broad와 SICER로 ì„ ë³„í•˜ì˜€ê³ , ì„ ë³„í•œ peaks 사ì´ì— 중첩(overlap)ë˜ëŠ” peakì˜ ê°œìˆ˜ëŠ” intervene으로 ì¸¡ì •í•˜ì—¬ venn diagram으로 나타내었다(Khan and Mathelier, 2017).
히스톤 H3K27ì—서 ì¼ì–´ë‚˜ëŠ” ë‘ ë³€í˜•, H3K27ac와 H3K27me3는 í¬ë¡œë§ˆí‹´ì—서 ê·¸ ë¶„í¬ í˜•íƒœê°€ 다른 것으로 ë³´ì¸ë‹¤. 즉 H3K27ac는 주로 ì „ì‚¬ì‹œìž‘ë¶€ìœ„ ê°™ì€ ì¢ì€ 부분ì—서 관찰ë˜ì§€ë§Œ, H3K27me3는 ìƒëŒ€ì 으로 긴 부분ì—서 ì—°ì†ì 으로 나타난다. ì´ëŸ¬í•œ íŠ¹ì§•ì„ ì‹œê°í™”í•˜ê³ ê·¸ ì°¨ì´ë¥¼ 비êµí•˜ê¸° 위해 public K562 ChIP-seq ë°ì´í„°ë¥¼ ë¶„ì„하였다. Fig. 1Aì—서 보여지는 것처럼, H3K27ac는 ì§§ì€ ê¸¸ì´ì— ê±¸ì³ ë¶„í¬í•˜ë©°, ë‚´ë¶€ì— ë°€ì§‘ 부위가 별ë„로 존재하는 ì–‘ìƒì„ 보였다. 하지만 H3K27me3는 ìƒëŒ€ì 으로 긴 ë¶€ìœ„ì— ê· ì¼í•˜ê²Œ ë¶„í¬í•˜ê³ 있었으며, í•˜ë‚˜ì˜ ì˜ì—(domain, ë„ë©”ì¸)ì„ í˜•ì„±í•˜ëŠ” 것처럼 보였다. ì´ëŸ¬í•œ ë¶„í¬ í˜•íƒœê°€ ìœ ì „ì²´ ì „ì²´ì—서 나타나는지 조사하기 위하여 ìœ ì „ìžì˜ ì „ì‚¬ì‹œìž‘ë¶€ìœ„ë¥¼ 기준으로 H3K27ac와 H3K27me3ì˜ ë¶„í¬ ìƒíƒœë¥¼ 비êµí•˜ì˜€ë‹¤(Fig. 1B). H3K27ac ìˆ˜ì¤€ì„ ê¸°ì¤€ìœ¼ë¡œ ì „ì‚¬ì‹œìž‘ë¶€ìœ„ë¥¼ ë‚˜ì—´í–ˆì„ ë•Œ, H3K27me3는 H3K27ac ìˆ˜ì¤€ì´ ë‚®ì€ ë¶€ìœ„ì—서 관찰ë˜ì—ˆë‹¤. ë‘ ë³€í˜•ì˜ ë°°íƒ€ì ì¸ ë¶„í¬ëŠ” ì „ì‚¬ì‹œìž‘ë¶€ìœ„ë¥¼ H3K27me3 수준으로 ì •ë ¬í–ˆì„ ë•Œë„ ê´€ì°°ë˜ì—ˆë‹¤. 그러나 ì´ë“¤ H3K27 ë³€í˜•ì˜ ë¶„í¬ ê¸¸ì´ë¥¼ 비êµí•˜ë©´ H3K27ac는 ì „ì‚¬ì‹œìž‘ë¶€ìœ„ì˜ ±2 Kb ì´ë‚´ì— 주로 ë¶„í¬í•˜ì§€ë§Œ, H3K27me3는 ±20 Kb까지 ë„“ì€ ì§€ì—ì— ê±¸ì³ ë¶„í¬í•˜ê³ 있는 ê²ƒì´ ê´€ì°°ë˜ì—ˆë‹¤. ì´ëŠ” 히스톤 H3K27 ë³€í˜•ì´ ë‚˜íƒ€ë‚˜ëŠ” 길ì´, 즉 ë¶„í¬ í˜•íƒœê°€ H3K27ac와 H3K27me3 사ì´ì—서 í¬ê²Œ ë‹¤ë¦„ì„ ë³´ì—¬ì¤€ë‹¤.
지금까지 다양한 ì¢…ë¥˜ì˜ ížˆìŠ¤í†¤ ë³€í˜•ì´ ë°í˜€ì¡Œìœ¼ë©°, ë³€í˜•ì˜ ì¢…ë¥˜ì— ë”°ë¼ ìœ ì „ì²´ì—서 ë¶„í¬í•˜ëŠ” 위치가 다른 것으로 나타났다. H3K27ac와 H3K27me3는 í¬ë¡œë§ˆí‹´ êµ¬ì¡°ì— ë¯¸ì¹˜ëŠ” ì˜í–¥ì´ 대비ë˜ê¸° ë•Œë¬¸ì— ì´ë“¤ ë‘ ë³€í˜•ì€ ë™ì¼í•œ í¬ë¡œë§ˆí‹´ 부위ì—서 함께 ì¼ì–´ë‚˜ì§€ ì•Šì„ ê²ƒìœ¼ë¡œ 예ìƒë˜ë©°, ì‹¤ì œë¡œ ìœ ì „ìžì™€ ì¸í•¸ì„œì—서 ì´ë“¤ 히스톤 변형 ë¶„í¬ì˜ ì—ìƒê´€ê´€ê³„ê°€ ë³´ê³ ë˜ì—ˆë‹¤(Wang et al., 2008; Katoh et al., 2018). ë˜í•œ 히스톤 ë³€í˜•ì˜ ì¢…ë¥˜ì— ë”°ë¼ ë¶„í¬ í˜•íƒœë„ ë‹¤ë¥¸ 것으로 ë³´ì´ë©°, ì´ëŠ” Encyclopedia of DNA Elements (ENCODE) 프로ì íŠ¸ì˜ ê²°ê³¼ì—ì„œë„ ì–¸ê¸‰ë˜ì—ˆë‹¤(Landt et al., 2012). ë”°ë¼ì„œ H3K27ac와 H3K27me3ì˜ ê²½ìš°ì²˜ëŸ¼ ê·¸ ë¶„í¬ í˜•íƒœê°€ 다르면 ChIP-seq ë°ì´í„°ì˜ ìƒë¬¼ì •ë³´í•™ì ë¶„ì„ì„ ìœ„í•´ 히스톤 ë³€í˜•ì´ ì¼ì–´ë‚˜ëŠ” ì§€ì—, 즉 peak를 ì„ ë³„í• ë•Œ, ë¶„ì„ ë°©ë²•ì„ ë‹¤ë¥´ê²Œ 사용해야 í• ê²ƒì´ë©°, ì´ëŠ” ìœ ì „ì²´ 수준ì—서 히스톤 ë³€í˜•ì„ ì œëŒ€ë¡œ í•´ì„하기 위해 중요한 ê³¼ì •ìœ¼ë¡œ ìƒê°ëœë‹¤.
H3K27ac와 H3K27me3 ChIP-seq ë°ì´í„° ë¶„ì„ ê³¼ì •ì—서 peak를 ì ì ˆí•˜ê²Œ ì„ ë³„í•˜ê¸° 위하여 ì´ ì„¸ 가지 ì¡°ê±´ì„ ì„ ì •í•˜ê³ ë¹„êµí•˜ì˜€ë‹¤(Fig. 2A). 가장 ì¼ë°˜ì 으로 사용ë˜ëŠ” ë¶„ì„ ë„êµ¬ì¸ MACS2와 넓게 ë¶„í¬í•˜ëŠ” 히스톤 ë³€í˜•ì— ì£¼ë¡œ 사용ë˜ëŠ” SICER를 ì„ íƒí•˜ì˜€ìœ¼ë©°, MACS2ì—서는 narrow peaks (narrow) 옵션과 broad peaks (broad) ì˜µì…˜ì„ ë¹„êµí•˜ì˜€ë‹¤. ì„ ë³„ëœ H3K27ac와 H3K27me3 peaks는 ëª¨ë‘ ê°ê°ì˜ 히스톤 ë³€í˜•ì´ ë§Žì´ ë¶„í¬í•˜ëŠ” ë¶€ìœ„ì— ìžë¦¬í•˜ê³ 있었다(Fig. 2B). ì´ ë•Œ H3K27acì˜ ê²½ìš°, narrow와 broad는 H3K27acê°€ 특히 ë§Žì´ ë¶„í¬í•˜ëŠ” 밀집 부위를 ìš°ì„ ì 으로 peak로 ì„ ë³„í•˜ëŠ” 반면 SICERì—서는 H3K27acê°€ ë˜ì–´ 있는 부위 ì „ì²´ê°€ 넓게 ì„ ë³„ë˜ì—ˆë‹¤. ì´ëŠ” ê³ ë¥´ê²Œ ë¶„í¬í•˜ì§€ 않는 H3K27acì˜ ë¶„í¬ í˜•íƒœì— ì˜í•´ 나타나는 ì°¨ì´ë¡œ ì¶”ì •ëœë‹¤. ìœ ì „ì²´ ì „ì²´ì—서 ì„ ë³„ëœ peaksì˜ ê¸¸ì´ë¥¼ 비êµí•˜ë©´, narrow, broad, SICER 방법 순으로 ê·¸ 길ì´ê°€ ì¦ê°€í•˜ì˜€ë‹¤(Fig. 2C). Narrow와 broad로 ì„ ë³„í•œ H3K27ac peaksì˜ í‰ê· 길ì´ëŠ” 491 bp와 1,915 bp였으며, ê°™ì€ ë°©ë²•ìœ¼ë¡œ ì„ ë³„ëœ H3K27me3 peaksì˜ ê¸¸ì´(433 bp와 1,686 bp)보다 조금 길었다. 하지만 SICER로 ì„ ë³„í• ê²½ìš°, H3K27me3 peaksì˜ í‰ê· 길ì´(6,036 bp)ê°€ H3K27ac peaksì˜ í‰ê· 길ì´(5,170 bp)보다 길었으며, ì´ëŠ” SICERì— ì˜í•œ peak ì„ ë³„ì´ H3K27me3ì˜ ë„“ì€ ë¶„í¬ í˜•íƒœë¥¼ 잘 ë°˜ì˜í•˜ëŠ” 것으로 í•´ì„í• ìˆ˜ 있다. ë™ì¼í•œ ChIP-seq ë°ì´í„°ë¡œë¶€í„° 길ì´ê°€ 다르게 ì„ ë³„ëœ peaksì˜ ížˆìŠ¤í†¤ 변형 ìˆ˜ì¤€ì„ ë¹„êµí•˜ê¸° 위해 CPM ê°’ì„ ê³„ì‚°í•˜ì˜€ìœ¼ë©°, CPM ê°’ì€ peaksì˜ ê¸¸ì´ì™€ 비례하여 ì¦ê°€í•˜ì˜€ë‹¤(Fig. 2D). CPMì€ peak ë‚´ì— ì¡´ìž¬í•˜ëŠ” readì˜ ìˆ˜ë¥¼ ì „ì²´ read 수로 ë³´ì •í•œ 값으로, peak ìžì²´ì˜ 길ì´ê°€ ê¸¸ìˆ˜ë¡ read 수가 ì¦ê°€í•˜ê¸° ë•Œë¬¸ì— peak 길ì´ì™€ CPM ëª¨ë‘ ìœ ì‚¬í•œ ê²½í–¥ì„±ì„ ë³´ì´ëŠ” 것으로 ìƒê°ëœë‹¤.
Peak ì„ ë³„ ë°©ë²•ì˜ ì ì ˆì„±ì„ íŒŒì•…í•˜ê¸° 위해 signal-to-background ratio (S/B ratio)를 계산하였다(Fig. 2E). 히스톤 ë³€í˜•ì´ ë§Žì´ ë¶„í¬í•˜ëŠ” peak를 기준으로 하여 peak로 ì„ ë³„ë˜ì§€ ì•Šì€ ë¶€ìœ„ë¥¼ non-peak regions으로 구분한 후, peak와 non-peak region ë‚´ì— ì¡´ìž¬í•˜ëŠ” read 수를 ì¸¡ì •í•˜ì˜€ë‹¤. ì¸¡ì •í•œ read 수로 peak와 non-peak regionì˜ CPM ê°’ì„ ê³„ì‚°í•˜ì˜€ìœ¼ë©°, peaks와 non-peak regionsì˜ í‰ê· CPM ê°’ì„ ë¹„êµí•¨ìœ¼ë¡œì¨ S/B ratio를 ë„출하였다. 세 가지 ë¶„ì„ ë°©ë²•ìœ¼ë¡œ ì„ ë³„í•œ peaksì—서 S/B ratio를 비êµí•œ ê²°ê³¼, H3K27acì˜ narrow와 broad, ê·¸ë¦¬ê³ narrow와 SICER 사ì´ì—서 ê·¸ ë¹„ìœ¨ì€ ê°ê° 2배와 2.5ë°° ì¦ê°€í•˜ì˜€ì§€ë§Œ, H3K27me3는 ê°ê° 7배와 18.8ë°° ì¦ê°€í•˜ì˜€ë‹¤(Fig. 2F). ì´ì²˜ëŸ¼ H3K27me3 ChIP-seq ë°ì´í„°ì˜ S/B ratioê°€ ë¶„ì„ ë°©ë²•ì— ë”°ë¼ í° ì°¨ì´ë¥¼ ë³´ì´ëŠ” ê²ƒì€ H3K27acì— ë¹„í•´ H3K27me3 ë°ì´í„°ê°€ peak ì„ ë³„ ë°©ë²•ì— ì˜í•´ ë” ë§Žì´ ì˜í–¥ ë°›ì„ ìˆ˜ 있ìŒì„ 시사한다. ë”°ë¼ì„œ 넓게 ë¶„í¬í•˜ëŠ” H3K27me3ì˜ peak는 MACS2ê°€ 아닌 SICER를 ì´ìš©í•˜ì—¬ ì„ ë³„í•˜ëŠ” ê²ƒì´ ì ì ˆí•œ 것으로 ìƒê°ëœë‹¤.
Public K562 ChIP-seq ë°ì´í„°ë¥¼ ì´ìš©í•˜ì—¬ 비êµí•œ peak ì„ ë³„ ë°©ë²•ì´ ì ì ˆí•œì§€ 확ì¸í•˜ê¸° 위해 본 연구실ì—서 수행한 K562 control (Con) H3K27ac ChIP-seq ë°ì´í„°ì™€ H3K27me3 ChIP-seq ë°ì´í„°ë¥¼ ë¶„ì„하였다. 2ë²ˆì˜ ë°˜ë³µ 실험으로 ì–»ì€ Con ChIP-seq ë°ì´í„°ëŠ” Spearman ìƒê´€ê´€ê³„ ë¶„ì„ì—서 나타난 것처럼 public ChIP-seq ë°ì´í„°ì™€ ë†’ì€ ìœ ì‚¬ì„±ì„ ë³´ì˜€ë‹¤(Fig. 3A, B). Con ChIP-seq ë°ì´í„°ì—서 ì„ ë³„í•œ H3K27ac와 H3K27me3 peaks는 히스톤 ë³€í˜•ì´ ë§Žì€ ë¶€ìœ„ì—서 나타났으며, peakì˜ ê¸¸ì´ë„ narrowì—서 SICER 순서로 ì¦ê°€í•˜ì˜€ë‹¤(Fig. 3C). Con ChIP-seq ë°ì´í„°ì˜ peaksì—서 S/B ratio를 비êµí•œ ê²°ê³¼, H3K27ac는 ëª¨ë“ ë¶„ì„ ë°©ë²•ì—서 í° ì°¨ì´ê°€ 나지 ì•Šì€ ë°˜ë©´(1.4~2.6ë°°), H3K27me3는 narrow와 broad, ê·¸ë¦¬ê³ narrow와 SICER 사ì´ì—서 ê°ê° 5.4배와 9ë°° ì°¨ì´ë¥¼ 보여주었다(Fig. 3D).
세 가지 방법으로 ì„ ë³„í•œ peaksì˜ S/B ratio는 H3K27acì— ë¹„í•´ H3K27me3ì—서 í° ì°¨ì´ë¥¼ 보였으며, ì´ëŸ¬í•œ 현ìƒì€ public ë°ì´í„°ì™€ Con ë°ì´í„° 모ë‘ì—서 나타났다. ì´ëŠ” ì§§ì€ ê¸¸ì´ì— ë¶„í¬í•˜ëŠ” H3K27acì— ë¹„í•´ 긴 ê±°ë¦¬ì— ë„“ê²Œ ë¶„í¬í•˜ëŠ” H3K27me3ê°€ ChIP-seq ë°ì´í„° ë¶„ì„ ë°©ë²•ì— ì˜í•´ ë” ë§Žì´ ì˜í–¥ ë°›ìŒì„ ì˜ë¯¸í•˜ë¯€ë¡œ 히스톤 ë³€í˜•ì˜ ë¶„í¬ í˜•íƒœì— ë”°ë¼ ì ì ˆí•œ peak ì„ ë³„ ë°©ë²•ì„ ì‚¬ìš©í•˜ëŠ” ê²ƒì´ í•„ìš”í•œ 것 같다. 아울러 publicê³¼ Con ChIP-seq ë°ì´í„° 모ë‘ì—서 H3K27acì˜ S/B ratioê°€ H3K27me3보다 높았는ë°, ì´ëŠ” ChIP ì‹¤í—˜ì— ì‚¬ìš©í•œ í•ì²´ì˜ íŠ¹ì´ì„±ê³¼ ê´€ë ¨ëœ ê²ƒìœ¼ë¡œ ì¶”ì •ëœë‹¤. Fig. 1A와 Fig. 3Cì—서 보여지는 것처럼 H3K27me3 ChIP-seq ë°ì´í„°ì˜ noise signalì´ H3K27ac ë°ì´í„°ì— 비해 높게 나타나며, ë†’ì€ noise는 ê²°ê³¼ì 으로 non-peak CPM ê°’ì„ ì¦ê°€ì‹œí‚¨ë‹¤.
ChIP-seq ë¼ì´ë¸ŒëŸ¬ë¦¬ë¡œ NGS ì‹œí€€ì‹±ì„ ìˆ˜í–‰í•˜ë©´ ì¼ì •한 길ì´ì˜ reads를 얻게 ë˜ëŠ”ë°, readì˜ ê°œìˆ˜ê°€ ë§Žì„ìˆ˜ë¡ sequencing depth는 ì¦ê°€í•œë‹¤. 하지만 시퀀싱 비용과 ë¶„ì„ ì‹œê°„ì´ ì¦ê°€í•˜ëŠ” 단ì ë„ ìžˆë‹¤. ë”°ë¼ì„œ ë°ì´í„°ë¥¼ 효율ì 으로 ë¶„ì„하기 위해 ì ì ˆí•œ 길ì´ì™€ ê°œìˆ˜ì˜ read를 얻어야 한다. ë¶„í¬ í˜•íƒœê°€ 다른 H3K27ac와 H3K27me3ì˜ ChIP-seq ë°ì´í„° ë¶„ì„ì— ì ì ˆí•œ sequencing depth를 알아보기 위해 Con ChIP-seq ë°ì´í„°ì˜ ì „ì²´ read 수를 네 가지 기준(15 M, 30 M, 60 M, 120 M)으로 ì œí•œí•˜ê³ , ì´í›„ ë¶„ì„ì„ ìˆ˜í–‰í•˜ì˜€ë‹¤(Fig. 4A). Genome browserì—서 ë³´ë©´ H3K27ac는 read 수와 ìƒê´€ì—†ì´ ìœ ì‚¬í•œ ë¶„í¬ í˜•íƒœë¥¼ 나타내지만, H3K27me3는 60 M ì´ìƒì˜ read 수ì—서 ê¸¸ê³ ê· ì¼í•œ ë¶„í¬ í˜•íƒœë¥¼ 보여준다(Fig. 4B). Sequencing depth와 peak ì„ ë³„ 사ì´ì˜ 관계를 조사하기 위해 H3K27acì˜ peak는 broad 방법으로, ê·¸ë¦¬ê³ H3K27me3ì˜ peak는 SICER 방법으로 ì„ ë³„í•˜ì˜€ë‹¤. H3K27ac는 60 M와 120 M readsì—서 30 Mì— ë¹„í•´ ê°ê° 1.9배와 3.6ë°° ë§Žì€ peaksê°€ ì„ ë³„ë˜ì—ˆê³ , H3K27me3는 read 수와 ìƒê´€ì—†ì´ ìœ ì‚¬í•œ ê°œìˆ˜ì˜ peaksê°€ ì„ ë³„ë˜ì—ˆë‹¤(Fig. 4C). 네 가지 ê¸°ì¤€ì˜ read ìˆ˜ì— ëŒ€í•˜ì—¬ peakì˜ S/B ratio를 비êµí•˜ì˜€ì„ 때 H3K27ac와 H3K27me3ì—서 15 M와 120 M 사ì´ì— 1.9ë°°~2.6ë°°ì˜ ì°¨ì´ë¥¼ 보였으나, ì´ëŠ” peak ì„ ë³„ ë°©ë²•ì— ëŒ€í•œ S/B ratioì˜ ê²©ì°¨ë³´ë‹¤ 작다(Fig. 4D). H3K27acì—서 ì„ ë³„ëœ peaksì˜ ìœ„ì¹˜ë¥¼ 비êµí•˜ê¸° 위해 중첩 여부를 ë¶„ì„한 ê²°ê³¼, 60 M와 120 Mì—서 새로운 peaksê°€ ë§Žì´ ì¶”ê°€ë˜ì—ˆìœ¼ë©°, 특히 120 Mì—서 700 bp ì´í•˜ì˜ peaksì˜ ì¦ê°€ê°€ ë‘드러진다(Fig. 4E). ì´ëŠ” ë§Žì€ read ìˆ˜ì— ì˜í•´ 새로 ì„ ë³„ëœ peaksê°€ 대부분 ì§§ì€ ê¸¸ì´ìž„ì„ ì•Œ 수 있다. 반면 H3K27me3는 15 Mì—서 120 M까지 peaksì˜ ëŒ€ë¶€ë¶„ì´ ì¤‘ì²©ë˜ë©°, read 수가 ì¦ê°€í• ìˆ˜ë¡ 1~4 Kb 사ì´ì˜ peaksê°€ ê°ì†Œí•˜ê³ , 10~50 Kb 사ì´ì˜ peaksê°€ ì¦ê°€í•œë‹¤(Fig. 4F). Fig. 4Bì—서 read ìˆ˜ì— ë”°ë¼ ì„ ë³„ëœ peaks를 H3K27ac와 H3K27me3ì˜ ë¶„í¬ ìˆ˜ì¤€ê³¼ 비êµí•˜ë©´, H3K27ac 120 Mì—서 새로 ì„ ë³„ëœ peaks는 ë³€í˜•ì´ ì¼ì–´ë‚˜ëŠ” 부위를 ì œëŒ€ë¡œ ë°˜ì˜í•˜ì§€ 못하지만 H3K27me3ê°€ 넓게 ë¶„í¬í•˜ëŠ” ì˜ì—ì€ 120 Mì—서 peak로 ì ì ˆížˆ ì„ ë³„ë˜ì—ˆë‹¤. ë”°ë¼ì„œ 히스톤 ë³€í˜•ì˜ ì¢…ë¥˜ì— ë”°ë¼ ë†’ì€ sequencing depthê°€ ì˜¤ížˆë ¤ false-positive peak ì„ ë³„ì„ ì´ˆëž˜í• ìˆ˜ 있는 것으로 ìƒê°ë˜ë©°, H3K27me3처럼 ë„“ì€ ë¶€ìœ„ì— ë¶„í¬í•˜ëŠ” 히스톤 ë³€í˜•ì€ sequencing depthì˜ ì¦ê°€ê°€ ì ì ˆí•œ peak ì„ ë³„ì— ê¸ì •ì 으로 작용하는 것으로 ë³´ì¸ë‹¤.
본 연구ì—서 ë¶„ì„한 Con ChIP-seq ë°ì´í„°ëŠ” paired-end ì‹œí€€ì‹±ì„ í†µí•´ 확보한 ë°ì´í„°ë¡œ, 2ê°œì˜ readsê°€ 1ê°œì˜ fragmentì—서 얻어지기 ë•Œë¬¸ì— Fig. 4ì—서 언급한 15~ 120 Mì˜ read 수는 7.5~60 Mì˜ fragments를 ë°˜ì˜í•œë‹¤. 그러나 single-end 시퀀싱으로 ì–»ì€ ChIP-seq ë°ì´í„°ëŠ” 1ê°œì˜ readê°€ 1ê°œì˜ fragment를 ë°˜ì˜í•˜ë¯€ë¡œ NGS ë°ì´í„°ì˜ sequencing depth는 시퀀싱 ë°©ë²•ì— ë”°ë¼ ë¹„êµí•´ì•¼ 한다. ENCODE ê°€ì´ë“œë¼ì¸ì— 따르면 mammalian cellsì—서 ìœ ì˜ë¯¸í•œ ChIP-seq ë°ì´í„°ë¥¼ 확보하기 위해 최소 1~2천만개(10~20 M) ì´ìƒì˜ uniquely mapped readsê°€ 필요하다(Landt et al., 2012). 넓게 ë¶„í¬í•˜ëŠ” 히스톤 ë³€í˜•ì˜ ê²½ìš° sequencing depthê°€ 높ì„ìˆ˜ë¡ ë°ì´í„°ì˜ 질ì ìˆ˜ì¤€ì´ ì¦ê°€í•˜ëŠ” ê²½í–¥ì„ ë³´ì˜€ëŠ”ë°, ì´ëŠ” sequencing depthì— ë”°ë¼ ë‹¤ì–‘í•œ 히스톤 ë³€í˜•ì˜ ChIP-seq ë°ì´í„°ë¥¼ 비êµí•œ 연구 결과와 ì¼ì¹˜í•œë‹¤(Jeon et al., 2020). ë”°ë¼ì„œ ì¢ê²Œ ë¶„í¬í•˜ëŠ” H3K27ac는 paired-end 기준 30 Mì˜ readsë§Œ ì–»ì–´ë„ ìœ ì˜ë¯¸í•œ ChIP-seq ë°ì´í„°ë¥¼ í™•ë³´í• ìˆ˜ 있지만, 넓게 ë¶„í¬í•˜ëŠ” H3K27me3는 ì ì–´ë„ 60 M ì´ìƒì˜ readsê°€ 필요한 것으로 ìƒê°ëœë‹¤. ë˜í•œ read ìˆ˜ì— ë”°ë¥¸ S/B ratio ì°¨ì´ëŠ” peak ì„ ë³„ ë°©ë²•ì— ë”°ë¥¸ ì°¨ì´ë³´ë‹¤ 작게 나타났으며, H3K27ac 120 Mì—서 S/B ratioê°€ 15 M보다 2.6ë°° 높았지만 ë¶€ì ì ˆí•œ peaksê°€ 함께 ì„ ë³„ë˜ì—ˆë˜ 것으로 ë³´ì•„ S/B ratio는 ë°ì´í„° ìžì²´ì˜ 질ì 수준 비êµë³´ë‹¤ëŠ” ë¶„ì„ ë°©ë²•ì˜ ë¹„êµì— 활용하는 ê²ƒì´ ì ì ˆí•˜ë‹¤ê³ ì‚¬ë£Œëœë‹¤.
본 연구 결과는 ìœ ì „ì²´ 수준ì—서 히스톤 H3K27ac와 H3K27me3ì˜ ë¶„í¬ ê¸¸ì´ê°€ 다르며, 넓게 ë¶„í¬í•˜ëŠ” H3K27me3는 ì¢ê²Œ ì¼ì–´ë‚˜ëŠ” H3K27acì— ë¹„í•´ peaks ì„ ë³„ ë°©ë²•ì´ ì¤‘ìš”í•¨ì„ ë³´ì—¬ì¤€ë‹¤. ë˜í•œ sequencing depthê°€ H3K27acì˜ ë°ì´í„° ë¶„ì„ì— ë³„ ì˜í–¥ì„ 미치지 않지만, 너무 ë†’ì€ sequencing depth는 peak ì„ ë³„ ê³¼ì •ì—서 ë¶€ì •ì ì¸ ì˜í–¥ì„ 미치는 것으로 나타났다. 반면 H3K27me3는 sequencing depthê°€ 높ì„ìˆ˜ë¡ ChIP-seq ë°ì´í„°ì˜ 질ì ìˆ˜ì¤€ì´ ì¦ê°€í•˜ì˜€ë‹¤. ë”°ë¼ì„œ 히스톤 ë³€í˜•ì— ëŒ€í•œ ChIP-seq ì‹¤í—˜ì„ ìˆ˜í–‰í• ë•Œ 히스톤 ë³€í˜•ì´ ë¶„í¬í•˜ëŠ” 형태를 ê³ ë ¤í•˜ì—¬ sequencing depth를 ê²°ì •í•˜ê³ , ë¶„ì„ ë°©ë²•ì„ ì„ íƒí•˜ëŠ” ê²ƒì´ í•„ìš”í•˜ë‹¤ê³ ì—¬ê²¨ì§„ë‹¤. ì´ë ‡ê²Œ 얻어진 결과는 ì •í™•í•œ ìƒë¬¼í•™ì ì •ë³´ë¥¼ ì œê³µí•˜ê³ ë‚˜ì•„ê°€ ì§ˆë³‘ì˜ ì§„ë‹¨ ë° ì¹˜ë£Œì œ ê°œë°œì— í™œìš©ë 수 ìžˆì„ ê²ƒì´ë‹¤.
15 million-120 million
Chromatin immuniprecipitation
Chromatin immuniprecipitation-sequencing
Control
Counts per million
Encyclopedia of DNA elements
Enhancer of zeste 2 polycomb epressive complex 2
Gene expression omnibus
Histone H3K27 acetylation
Histone H3K27 tri-methylation
Histone H3K36 tri-methylation
Histone H3K4 mono-methylation
Histone H3K4 tri-methylation
Histone H3K9 tri-methylation
Histone deacetylase
Integrative genomics viewer
Mapping quality
Micrococcal nuclease
Next-generation sequencing
Signal-to-background ratio
Tris-EDTA
Transcription start sites
This study was supported by the 『BK21 Four Program〠of Pusan National University.
The authors have declared no conflict of interest.