Search for


TEXT SIZE

search for



CrossRef (0)
ChIP-seq Analysis of Histone H3K27ac and H3K27me3 Showing Different Distribution Patterns in Chromatin
Biomed Sci Letters 2022;28:109-119
Published online June 30, 2022;  https://doi.org/10.15616/BSL.2022.28.2.109
© 2022 The Korean Society For Biomedical Laboratory Sciences.

Jin Kang* and AeRi Kim†,* *

Department of Molecular Biology, College of Natural Sciences, Pusan National University, Busan 46241, Korea
Correspondence to: AeRi Kim. Department of Molecular Biology, College of Natural Sciences, Pusan National University, Busan 46241, Korea.
Tel: +82-51-510-3684, Fax: +82-51-513-9258, e-mail: kimaeri@pusan.ac.kr
*Post-Doctor, **Professor.
Received June 3, 2022; Revised June 21, 2022; Accepted June 22, 2022.
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
 Abstract
Histone proteins can be modified by the addition of acetyl group or methyl group to specific amino acids. The modifications have different distribution patterns in chromatin. Recently, histone modifications are studied based on ChIP-seq data, which requires reasonable analysis of sequencing data depending on their distribution patterns. Here we have analyzed histone H3K27ac and H3K27me3 ChIP-seq data and it showed that the H3K27ac is enriched at narrow regions while H3K27me3 distributes broadly. To properly analyze the ChIP-seq data, we called peaks for H3K27ac and H3K27me3 using MACS2 (narrow option and broad option) and SICER methods, and compared propriety of the peaks using signal-to-background ratio. As results, H3K27ac-enriched regions were well identified by both methods while H3K27me3 peaks were properly identified by SICER, which indicates that peak calling method is more critical for histone modifications distributed broadly. When ChIP-seq data were compared in different sequencing depth (15, 30, 60, 120 M), high sequencing depth caused high false-positive rate in H3K27ac peak calling, but it reflected more properly the broad distribution pattern of H3K27me3. These results suggest that sequencing depth affects peak calling from ChIP-seq data and high sequencing depth is required for H3K27me3. Taken together, peak calling tool and sequencing depth should be chosen depending on the distribution pattern of histone modification in ChIP-seq analysis.
Keywords : H3K27ac, H3K27me3, ChIP-Seq, Peak calling, Sequencing depth
서 론

ížˆìŠ¤í†¤ì€ ì§„í•µì„¸í¬ì˜ 핵 ë‚´ì—서 DNA와 결합하여 í¬ë¡œë§ˆí‹´(chromatin)ì„ êµ¬ì„±í•˜ëŠ” 구조 단백질ì´ë‹¤(Wolffe and Guschin, 2000; Cutter and Hayes, 2015). 4ì¢…ë¥˜ì˜ ížˆìŠ¤í†¤ 단백질(H2A, H2B, H3, H4)ì€ 2개씩 결합하여 히스톤 팔량체(histone octamer)를 ì´ë£¨ë©°, ì´ íŒ”ëŸ‰ì²´ëŠ” 약 146 bpì˜ DNAì— ê°ê²¨ í¬ë¡œë§ˆí‹´ì˜ êµ¬ì¡°ì  ê¸°ë³¸ ë‹¨ìœ„ì²´ì¸ ë‰´í´ë ˆì˜¤ì¢€(nucleosome)ì„ í˜•ì„±í•œë‹¤. ì´ ë•Œ, 히스톤과 DNA 사ì´ì˜ 정전기ì ì¸ ì¸ë ¥ì´ 뉴í´ë ˆì˜¤ì¢€ì„ 형성하는 기본 ì›ë¦¬ì´ë©°, ì´ë¥¼ 바탕으로 긴 DNA ê°€ë‹¥ì„ ì²´ê³„ì ìœ¼ë¡œ ì‘축하여 í¬ë¡œë§ˆí‹´ 구조를 만든다. 하지만 전사ì¸ìž(transcription factor)나 RNA 중합효소(polymerase) 입장ì—서 ë³´ë©´ 뉴í´ë ˆì˜¤ì¢€ì€ ì´ ë‹¨ë°±ì§ˆë“¤ì´ DNAì— ê²°í•©í•˜ëŠ” ê²ƒì„ ë§‰ëŠ” 장애물ì´ë‹¤. ì´ë¥¼ 해결하기 위해 DNA와 히스톤 사ì´ì˜ ê²°í•©ì„ ì•½í™”ì‹œí‚¤ëŠ” ë°©ë²•ì´ ì¡´ìž¬í•˜ëŠ”ë°, 히스톤 ë‹¨ë°±ì§ˆì˜ í™”í•™ì  ë³€í˜•ì´ ì¤‘ìš”í•œ ë¶€ë¶„ì„ ë‹´ë‹¹í•œë‹¤.

히스톤 ë‹¨ë°±ì§ˆì˜ N-ë§ë‹¨ 아미노산ì—는 아세틸기나 메틸기 ê°™ì€ í™”í•™ ê·¸ë£¹ì´ ê°€ì—­ì ìœ¼ë¡œ ê²°í•©í•  수 있는ë°, ì´ í™”í•™ì  ë³€í˜•ë“¤ì„ ížˆìŠ¤í†¤ 변형(histone modifications)ì´ë¼ ì¼ì»«ëŠ”ë‹¤(Bannister and Kouzarides, 2011). 히스톤 ë³€í˜•ì€ ì•„ë¯¸ë…¸ì‚°ì˜ ìœ„ì¹˜ì™€ 결합하는 화학 ê·¸ë£¹ì˜ ì¢…ë¥˜ì— ë”°ë¼ ë‹¤ì–‘í•˜ë©°, ì§ì ‘ì ìœ¼ë¡œ í¬ë¡œë§ˆí‹´ 구조를 변화시키거나 구조를 변화시키는 ë‹¨ë°±ì§ˆì„ ëª¨ì§‘í•˜ëŠ”ë°(recruit) 관여한다. 아세틸화(acetylation)와 메틸화(methylation)는 대표ì ì¸ 히스톤 변형으로 주로 리신(lysine, K) 잔기ì—서 ì¼ì–´ë‚œë‹¤. ì•„ì„¸í‹¸í™”ì˜ ê²½ìš°, 히스톤 ë‹¨ë°±ì§ˆì˜ ì–‘ì „í•˜ë¥¼ ê°ì†Œì‹œí‚¤ë©°, ê·¸ ê²°ê³¼ DNAì™€ì˜ ê²°í•©ì„ ì•½í™”ì‹œì¼œ í¬ë¡œë§ˆí‹´ 구조를 활성화시킨다. ì´ì— 반해 메틸화는 ë³€í˜•ì´ ì¼ì–´ë‚˜ëŠ” ì•„ë¯¸ë…¸ì‚°ì˜ ìœ„ì¹˜ì— ë”°ë¼ ê·¸ ì—­í• ì´ ë‹¤ë¥´ë‹¤. 히스톤 H3ì˜ 4번 ë¦¬ì‹ ì˜ 3-메틸화(H3K4me3)는 전사가 활발히 ì¼ì–´ë‚˜ëŠ” 프로모터(promoter)ì—서 전사ì¸ìžì˜ ëª¨ì§‘ì„ ë„와주지만(Vermeulen et al., 2007; Lauberth et al., 2013), H3K27me3는 í¬ë¡œë§ˆí‹´ 구조를 불활성화시키는 ë‹¨ë°±ì§ˆì„ ë¶ˆëŸ¬ë“¤ì—¬ ìœ ì „ìž ì „ì‚¬ ì–µì œì— ê¸°ì—¬í•œë‹¤(Cao et al., 2002; Min et al., 2003). 특히 히스톤 H3K27ac와 H3K27me3는 ê°™ì€ ì•„ë¯¸ë…¸ì‚°ì—서 ì¼ì–´ë‚˜ì§€ë§Œ í¬ë¡œë§ˆí‹´ êµ¬ì¡°ì— ë¯¸ì¹˜ëŠ” ì˜í–¥ì´ ìƒë°˜ë˜ê¸° ë•Œë¬¸ì— ì´ë“¤ ë³€í˜•ì— ëŒ€í•œ ë§Žì€ ì—°êµ¬ë“¤ì´ ìˆ˜í–‰ë˜ì–´ 왔다(Kim and Kim, 2011; Bowman et al., 2014; Chrysanthou et al., 2022). ë˜í•œ 히스톤 ë³€í˜•ì´ ì¼ì–´ë‚˜ëŠ” 유전체 ìƒì˜ 길ì´, 즉 ë¶„í¬ í˜•íƒœë„ ížˆìŠ¤í†¤ ë³€í˜•ì˜ ì¢…ë¥˜ì— ë”°ë¼ ë‹¤ë¥´ë‹¤(Landt et al., 2012). 예를 들어 H3K4me3와 H3K27ac는 유전ìžì˜ 전사시작부위(transcription start site) ì£¼ë³€ì˜ ì§§ì€(ì¢ì€) 지역ì—서 관찰ë˜ì§€ë§Œ, H3K9me3나 H3K27me3는 ìƒëŒ€ì ìœ¼ë¡œ 긴(ë„“ì€) ì§€ì—­ì— ì—°ì†ì ìœ¼ë¡œ ë¶„í¬í•˜ê³  있다.

히스톤 ë³€í˜•ì€ ì•”ì„ í¬í•¨í•œ 다양한 질병과 ì—°ê´€ì„±ì„ ë³´ì¸ë‹¤(Chi et al., 2010; Fernandes et al., 2020). 비정ìƒì ì¸ 히스톤 ë³€í˜•ì€ ìœ ì „ìžì˜ 전사 ìƒíƒœë¥¼ 변화시킬 수 있으며, ê·¸ ê²°ê³¼ ì§ˆë³‘ì„ ì´ˆëž˜í•  수 있다. ì œ1형 당뇨 환ìžì™€ 고혈압 유발 ìƒì¥ 모ë¸ì—서 H3K27ac를 í¬í•¨í•œ 히스톤 H3ì˜ ì•„ì„¸í‹¸í™” ìˆ˜ì¤€ì´ ë¹„ì •ìƒì ìœ¼ë¡œ ì¦ê°€í•˜ì˜€ìœ¼ë©°(Lee et al., 2012; Wang et al., 2019), 전립선암, 위암, 췌장암ì—서는 H3K27me3 ì¦ê°€ì— ì˜í•œ ì•” 억제 유전ìžë“¤(tumor suppressor genes)ì˜ ë°œí˜„ ê°ì†Œê°€ ë³´ê³ ë˜ì—ˆë‹¤(Yu et al., 2007; Fujii and Ochiai, 2008; Ougolkov et al., 2008). ì´ëŸ¬í•œ 연구 결과를 바탕으로 히스톤 변형 효소 유전ìžë¥¼ 표ì ìœ¼ë¡œ 한 치료제가 개발ë˜ê³  있으며, 실제로 히스톤 H3K27 ë³€í˜•ì„ ë‹´ë‹¹í•˜ëŠ” enhancer of zeste homolog 2 (EZH2)와 histone deacetylase (HDAC) íš¨ì†Œì˜ ì–µì œì œê°€ í•­ì•”ì œì˜ íš¨ê³¼ë¥¼ ìƒìŠ¹ì‹œí‚¨ë‹¤ëŠ” ë³´ê³ ë„ ìžˆë‹¤(Fiskus et al., 2009). ë˜í•œ 유전체 ìˆ˜ì¤€ì˜ ížˆìŠ¤í†¤ 변형 연구를 통해 새로운 질병 관련 유전ìžë¥¼ ë™ì •해낼 ìˆ˜ë„ ìžˆë‹¤. 천ì‹, 알츠하ì´ë¨¸, ê°‘ìƒì„ ì•” 환ìžì˜ 세í¬ì—서 수행한 유전체 ì „ì²´ì˜ H3K27ac ë¶„í¬ ì—°êµ¬ëŠ” 새로운 질병 관련 유전ìžë¥¼ 선별해냈으며, 치료제 ê°œë°œì˜ í‘œì  ìœ ì „ìž í›„ë³´ë¥¼ 제시하였다(Marzi et al., 2018; McErlean et al., 2020; Zhang et al., 2021). ì´ì²˜ëŸ¼ 히스톤 ë³€í˜•ì— ëŒ€í•œ 연구 결과는 ì§ˆë³‘ì˜ ì§„ë‹¨ ë° ì˜ˆí›„ 예측, 그리고 치료제 개발 등 다양한 분야ì—서 활용ë˜ê³  있다.

히스톤 ë³€í˜•ì€ ì£¼ë¡œ 면역침강법(chromatin immunoprecipitation, ChIP)ì„ ì´ìš©í•˜ì—¬ 연구ëœë‹¤(Kuo and Allis, 1999). ì´ëŠ” í¬ë¦„알ë°ížˆë“œë¡œ ê³ ì •ëœ í¬ë¡œë§ˆí‹´ì„ 뉴í´ë ˆì˜¤ì¢€ 단위로 절단한 후, ì›í•˜ëŠ” 히스톤 변형 항체와 ë°˜ì‘시키고, ì¹¨ì „ëœ ë‰´í´ë ˆì˜¤ì¢€ì˜ DNA를 정제하여 ë¶„ì„하는 기법ì´ë‹¤. 과거ì—는 PCR 기법으로 ChIPed DNAì˜ íŠ¹ì • ë¶€ë¶„ë§Œì„ ë¶„ì„하였으나, 최근ì—는 차세대염기서열분ì„(next-generation sequencing, NGS)ì´ë¼ê³  ì¼ì»«ëŠ” 시퀀싱 ê¸°ë²•ì´ ê°œë°œë˜ì–´ 유전체 ìˆ˜ì¤€ì˜ ë¶„ì„ì´ ê°€ëŠ¥í•˜ê²Œ ë˜ì—ˆë‹¤. 본 연구는 ë¶„í¬ í˜•íƒœê°€ 다른 히스톤 ë³€í˜•ë“¤ì˜ ChIP-seq ë°ì´í„°ë¥¼ ì ì ˆížˆ ë¶„ì„하기 위하여, H3K27ac와 H3K27me3를 대ìƒìœ¼ë¡œ NGS ë°ì´í„° peak 선별 프로그램들(MACS2와 SICER)ì„ ë¹„êµí•˜ì˜€ìœ¼ë©°, ì´ë“¤ ë°©ë²•ì˜ ì ì ˆì„±ì„ peak로 선별ë˜ì§€ ì•Šì€ ë¶€ë¶„ê³¼ 비êµí•˜ì—¬ ê²€ì¦í•˜ì˜€ë‹¤. ë˜í•œ ChIP-seq ë°ì´í„°ë¥¼ 다양한 용량(read 수)ì—서 ë¶„ì„하여 히스톤 변형 ë¶„í¬ í˜•íƒœì— ë”°ë¥¸ ChIP-seq ë°ì´í„°ì˜ ì§ˆì  ìˆ˜ì¤€ê³¼ 시퀀싱 용량(sequencing depth) 사ì´ì˜ ìƒê´€ê´€ê³„를 조사하였다.

재료 ë° ë°©ë²•

Public K562 ChIP-seq ë°ì´í„° ë¶„ì„

사람 ì í˜ˆêµ¬ 유래 세í¬ì£¼ K562ì˜ H3K27ac와 H3K27me3 ChIP-seq raw fastq 파ì¼ì€ GEO databaseì—서 확보하였으며(H3K27ac, GSE66023; H3K27me3, GSE167869), Galaxy 플랫í¼ì„ ì´ìš©í•˜ì—¬ ë¶„ì„하였다(https://usegalaxy.org). ì—¼ê¸°ì„œì—´ì˜ ì •í™•ë„ê°€ ë‚®ì€ reads는 Filter by quality와 FASTQ Quality Trimmerë¼ëŠ” ë¶„ì„ ë„구를 ì´ìš©í•˜ì—¬ 제거하였고, ì§ˆì  ìˆ˜ì¤€(quality)ì´ ë³´ì •ëœ reads를 Bowtie2를 ì´ìš©í•˜ì—¬ 사람 hg19 canonical reference genomeì— ì •ë ¬(alignment, mapping)하였다(Langmead and Salzberg, 2012). Reads를 정렬한 bam 파ì¼ì—서 mapping quality (MAPQ)ê°€ 20 미만ì´ê±°ë‚˜ PCR duplicate로 추정ë˜ëŠ” reads를 제거하여 정확히 ì •ë ¬ëœ readsë§Œì„ ì´í›„ ë¶„ì„ì— ì‚¬ìš©í•˜ì˜€ë‹¤. ChIP-seq ë°ì´í„°ë¥¼ 시ê°í™”하기 위해 BamCoverage를 ì´ìš©í•˜ì—¬ bigwig 파ì¼ì„ ìƒì„±í•˜ì˜€ìœ¼ë©°(Ramírez et al., 2016), H3K27ac와 H3K27me3ì˜ ë¶„í¬ëŠ” Integrative genomics viewer (IGV)ì—서 관찰하였다(Thorvaldsdóttir et al., 2013). UCSC databaseì—서 제공하는 사람 유전ìžì— 대한 bed 파ì¼ì„ 기준으로 전사시작부위 ì£¼ë³€ì˜ H3K27ac와 H3K27me3 ë¶„í¬ ìˆ˜ì¤€ì„ deeptoolsì˜ computeMatrix로 ë¶„ì„하고 plotHeatmap으로 나타내었다.

히스톤 H3K27 ë³€í˜•ì˜ peak 선별

H3K27ac와 H3K27me3ê°€ ë§Žì´ ê´€ì°°ë˜ëŠ” 지역(peak)ì„ ì„ ë³„í•˜ê¸° 위해 ì´ ì„¸ 가지 ë¶„ì„ ë°©ë²•ì„ ì‚¬ìš©í•˜ì˜€ë‹¤. 첫 번째로 MACS2ì—서 default parameter로 ë‘ ë³€í˜•ì˜ narrow peak를 선별하였고, ë™ì¼í•œ bam 파ì¼ì—서 MACS2ì˜ broad optionì„ ì‚¬ìš©í•˜ì—¬ ë°ì´í„°ë¥¼ ë¶„ì„하였다(Zhang et al., 2008). 마지막으로 SICERì—서 default parameter를 ì´ìš©í•˜ì—¬ peak를 선별하고 비êµí•˜ì˜€ìœ¼ë©°(Zang et al., 2009), SICER로 ë¶„ì„하기 위해 bam 파ì¼ì„ bed 파ì¼ë¡œ 변환하여 사용하였다. 모든 peak 선별 과정ì—서 ChIP ì‹¤í—˜ì— ëŒ€í•œ input ChIP-seq ë°ì´í„°ë¥¼ control로 사용하였다.

Signal-to-background ratio 계산

Peak 선별 ë°©ë²•ì˜ ì ì ˆì„±ì„ íŒë‹¨í•˜ê¸° 위해 signal-to-background ratio를 비êµí•˜ì˜€ë‹¤. 세 가지 ë¶„ì„ ë°©ë²•ì— ì˜í•´ ì„ ë³„ëœ peaks를 기준으로 히스톤 ë³€í˜•ì´ ì¼ì–´ë‚˜ì§€ 않는 지역(non-peak regions)ì„ ComplementBed로 지정하였다. Peaks와 non-peak regionsì— ì •ë ¬ëœ read 수를 측정하여 counts per million (CPM) ê°’ì„ ê³„ì‚°í•˜ì˜€ìœ¼ë©°(CPM=(특정 ì§€ì—­ì˜ read 수)/((ì „ì²´ read 수)/106)), ì´ ë•Œ ì „ì²´ read 수는 flagstatì„ ì´ìš©í•˜ì—¬ 측정하였다. 그리고 Peaksì˜ í‰ê·  CPM ê°’ì„ non-peak regionsì˜ í‰ê·  CPM 값으로 ë‚˜ëˆ”ìœ¼ë¡œì¨ signal-to-background ratio를 ë„출하였다.

ì„¸í¬ ë°°ì–‘

본 ì‹¤í—˜ì— ì‚¬ìš©í•œ K562 세í¬ì£¼ëŠ” ATCCì—서 구입하였으며, 배지는 Gibcoì—서 구입한 시약들로 제작하였다. 사용한 배지는 10% FBS, 1% Penicillin/Streptomycin, 2 mM L-Glutamine, 20 mM HEPESê°€ í¬í•¨ëœ RPMI 1640ì´ì—ˆìœ¼ë©°, 세í¬ëŠ” 37℃, 5% CO2 ì¡°ê±´ì—서 ë°°ì–‘ë˜ì—ˆë‹¤.

í¬ë¡œë§ˆí‹´ 면역침강법(ChIP)

ChIP ì‹¤í—˜ì€ ë‹¤ìŒê³¼ ê°™ì´ ìˆ˜í–‰í•˜ì˜€ë‹¤(Kuo and Allis, 1999). K562 (1×107) 세í¬ë¥¼ 1% formaldehyde (Sigma) ì¡°ê±´ì—서 10ë¶„ê°„ 처리한(crosslinking) 후, 0.125 M Glycine (Invitrogen) 조건으로 ë°˜ì‘ì„ ì¤‘ë‹¨í•˜ì˜€ë‹¤. Cell lysis buffer를 처리하고 10ë¶„ê°„ ì–¼ìŒì—서 ë°˜ì‘한 후, ì›ì‹¬ë¶„리를 통해 í•µì„ ë¶„ë¦¬í•˜ì˜€ìœ¼ë©°, 분리한 í•µì— MNase (Worthington Biochemical Corp)를 37℃, 15ë¶„ê°„ 처리하여 í¬ë¡œë§ˆí‹´ì„ ë‹¨ì¼ ë‰´í´ë ˆì˜¤ì¢€ 수준으로 절단하였다. í•µì„ ë¶„í•´í•œ 후, ì ˆë‹¨ëœ í¬ë¡œë§ˆí‹´ì„ Protein A agarose beads (Millipore)와 ë°˜ì‘시켜(4℃, overnight) 면역침강 ì „ì— beadsì— ë¹„íŠ¹ì´ì ìœ¼ë¡œ 결합하는 í¬ë¡œë§ˆí‹´ì„ 제거하였다(preclearing). ì´í›„, 히스톤 H3K27ac ë˜ëŠ” H3K27me3ì— íŠ¹ì´ì ì¸ 항체와 ë°˜ì‘시키고(4℃, 3시간), Protein A agarose beads를 ì´ìš©í•˜ì—¬ í•­ì²´ì— ê²°í•©í•œ í¬ë¡œë§ˆí‹´ì„ 선별 분리하였다. ë으로 phenol extraction ê¸°ë²•ì„ ì´ìš©í•˜ì—¬ DNA를 분리 정제하였다. ChIP ì‹¤í—˜ì— ì‚¬ìš©í•œ 항체는 Abcamê³¼ Milliporeì—서 구입하였다(H3K27ac, ab4729; H3K27me3, 07-449).

ChIP-seq ë¼ì´ë¸ŒëŸ¬ë¦¬ 제작

ChIP-seq ë¼ì´ë¸ŒëŸ¬ë¦¬ëŠ” NEBNext Ultra II DNA Library Prep Kit (New England Biolabs)를 ì´ìš©í•˜ì—¬ 제작하였으며, H3K27ac와 H3K27me3ì— ëŒ€í•œ ChIP-seq ë¼ì´ë¸ŒëŸ¬ë¦¬ ì œìž‘ì€ ë³¸ 연구실ì—서 ê¸°ì¡´ì— ìˆ˜í–‰í–ˆë˜ ì¡°ê±´ê³¼ ë™ì¼í•˜ê²Œ 진행하였다(Kang et al., 2021a; Kim et al., 2021). ChIPed DNA (H3K27ac, 10 ng; H3K27me3, 1 ng)ì˜ ì–‘ ë§ë‹¨ì„ 비ì ì°©ì„± ë§ë‹¨(blunt end)으로 만들고, 3' ë§ë‹¨ì— ì•„ë°ë‹Œì„ 추가한 후 AT base pairing으로 NEBNext Adapter를 연결하였다. Adapterê°€ ì—°ê²°ëœ DNA는 NEBNext Multiplex Oligos for Illumina (96 Unique Dual Index Primer Pairs)로 PCRì„ ìˆ˜í–‰í•˜ì—¬ ì¦í­ì‹œì¼°ê³  (H3K27ac, 7 cycles; H3K27me3, 11 cycles), NEBNext Sample Purification Beads로 약 175 bp 길ì´ì˜ DNA를 선별한 후, ë¼ì´ë¸ŒëŸ¬ë¦¬ë¥¼ 제작하였다. 제작한 ë¼ì´ë¸ŒëŸ¬ë¦¬ì˜ ë†ë„는 Qubit dsDNA HS assay kit (Invitrogen)로 측정하였으며, NGS ì‹œí€€ì‹±ì€ NovaSeq 6000ì—서 100 bp paired-end 조건으로 수행하여 약 6천만개(60 M)ì˜ reads를 얻었다.

ChIP-seq ë°ì´í„° ë¶„ì„

Paired-end ì‹œí€€ì‹±ì„ í†µí•´ ì–»ì€ H3K27ac와 H3K27me3 ChIP-seq ë°ì´í„° ë¶„ì„ì€ ë³¸ 연구실ì—서 ê¸°ì¡´ì— ìˆ˜í–‰í•˜ë˜ ë¶„ì„ ê³¼ì •ê³¼ ë™ì¼í•˜ê²Œ 진행하였으며(Kim et al., 2020; Kang et al., 2021b; Kang et al., 2021c), single-end 시퀀싱으로 ì–»ì€ public ë°ì´í„° ë¶„ì„ ë°©ë²•ì„ ì¼ë¶€ 수정하였다. Fastq 파ì¼ì˜ quality는 FastQC로 확ì¸í•˜ì˜€ê³ , read ë‚´ qualityê°€ ë‚®ì€ ì—¼ê¸°ëŠ” Trimmomatic으로 제거하였다(Bolger et al., 2014). Quality를 보정한 reads는 hg19 canonical reference genomeì— Bowtie2로 정렬하였고, MAPQê°€ 20 미만ì´ê±°ë‚˜ PCR duplicate로 ì˜ì‹¬ë˜ëŠ” reads는 제거하였다. ChIP-seq ë°ì´í„°ì˜ 시ê°í™”를 위해 BamCoverage를 ì´ìš©í•˜ì—¬ bigwig 파ì¼ì„ ìƒì„±í•˜ì˜€ê³ , IGV를 통해 ë³€í˜•ì˜ ë¶„í¬ë¥¼ 관찰하였다. ChIP-seq ë°ì´í„°ì˜ ì „ì²´ read 수를 제한하기 위해 Downsample SAM/BAMì„ ì´ìš©í•˜ì—¬ 기존 bam 파ì¼ë¡œë¶€í„° 약 15 M, 30 M, 60 M, 120 Mì˜ readsì— í•´ë‹¹í•˜ëŠ” bam 파ì¼ì„ 새로 ìƒì„±í•˜ì˜€ìœ¼ë©°, ìƒì„±ëœ bam 파ì¼ì„ bigwig 파ì¼ë¡œ 변환하여 ê° ížˆìŠ¤í†¤ ë³€í˜•ì˜ ë¶„í¬ë¥¼ 관찰하였다. Read 수를 제한한 ë°ì´í„°ì—서 H3K27ac와 H3K27me3ì˜ peak는 MACS2 broad와 SICER로 선별하였고, 선별한 peaks 사ì´ì— 중첩(overlap)ë˜ëŠ” peakì˜ ê°œìˆ˜ëŠ” intervene으로 측정하여 venn diagram으로 나타내었다(Khan and Mathelier, 2017).

ê²°ê³¼ ë° ê³ ì°°

히스톤 H3K27 ë³€í˜•ì˜ ë¶„í¬ í˜•íƒœ 비êµ

히스톤 H3K27ì—서 ì¼ì–´ë‚˜ëŠ” ë‘ ë³€í˜•, H3K27ac와 H3K27me3는 í¬ë¡œë§ˆí‹´ì—서 ê·¸ ë¶„í¬ í˜•íƒœê°€ 다른 것으로 ë³´ì¸ë‹¤. 즉 H3K27ac는 주로 전사시작부위 ê°™ì€ ì¢ì€ 부분ì—서 관찰ë˜ì§€ë§Œ, H3K27me3는 ìƒëŒ€ì ìœ¼ë¡œ 긴 부분ì—서 ì—°ì†ì ìœ¼ë¡œ 나타난다. ì´ëŸ¬í•œ íŠ¹ì§•ì„ ì‹œê°í™”하고 ê·¸ ì°¨ì´ë¥¼ 비êµí•˜ê¸° 위해 public K562 ChIP-seq ë°ì´í„°ë¥¼ ë¶„ì„하였다. Fig. 1Aì—서 보여지는 것처럼, H3K27ac는 ì§§ì€ ê¸¸ì´ì— ê±¸ì³ ë¶„í¬í•˜ë©°, ë‚´ë¶€ì— ë°€ì§‘ 부위가 별ë„로 존재하는 ì–‘ìƒì„ 보였다. 하지만 H3K27me3는 ìƒëŒ€ì ìœ¼ë¡œ 긴 ë¶€ìœ„ì— ê· ì¼í•˜ê²Œ ë¶„í¬í•˜ê³  있었으며, í•˜ë‚˜ì˜ ì˜ì—­(domain, ë„ë©”ì¸)ì„ í˜•ì„±í•˜ëŠ” 것처럼 보였다. ì´ëŸ¬í•œ ë¶„í¬ í˜•íƒœê°€ 유전체 ì „ì²´ì—서 나타나는지 조사하기 위하여 유전ìžì˜ 전사시작부위를 기준으로 H3K27ac와 H3K27me3ì˜ ë¶„í¬ ìƒíƒœë¥¼ 비êµí•˜ì˜€ë‹¤(Fig. 1B). H3K27ac ìˆ˜ì¤€ì„ ê¸°ì¤€ìœ¼ë¡œ 전사시작부위를 ë‚˜ì—´í–ˆì„ ë•Œ, H3K27me3는 H3K27ac ìˆ˜ì¤€ì´ ë‚®ì€ ë¶€ìœ„ì—서 관찰ë˜ì—ˆë‹¤. ë‘ ë³€í˜•ì˜ ë°°íƒ€ì ì¸ ë¶„í¬ëŠ” 전사시작부위를 H3K27me3 수준으로 ì •ë ¬í–ˆì„ ë•Œë„ ê´€ì°°ë˜ì—ˆë‹¤. 그러나 ì´ë“¤ H3K27 ë³€í˜•ì˜ ë¶„í¬ ê¸¸ì´ë¥¼ 비êµí•˜ë©´ H3K27ac는 ì „ì‚¬ì‹œìž‘ë¶€ìœ„ì˜ ±2 Kb ì´ë‚´ì— 주로 ë¶„í¬í•˜ì§€ë§Œ, H3K27me3는 ±20 Kb까지 ë„“ì€ ì§€ì—­ì— ê±¸ì³ ë¶„í¬í•˜ê³  있는 ê²ƒì´ ê´€ì°°ë˜ì—ˆë‹¤. ì´ëŠ” 히스톤 H3K27 ë³€í˜•ì´ ë‚˜íƒ€ë‚˜ëŠ” 길ì´, 즉 ë¶„í¬ í˜•íƒœê°€ H3K27ac와 H3K27me3 사ì´ì—서 í¬ê²Œ ë‹¤ë¦„ì„ ë³´ì—¬ì¤€ë‹¤.

Fig. 1. Genome-wide distribution of histone H3K27ac and H3K27me3. (A) Genome browser shows distribution of histone H3K27ac and H3K27me3 in K562 cells. Public K562 ChIP-seq data were obtained from GEO database. Red and pale blue shadows represent H3K27ac- and H3K27me3-enriched regions, respectively. (B) Distribution of H3K27ac and H3K27me3 was visualized using density heatmap at transcription start sites (TSSs) ±5 Kb. TSSs were sorted by H3K27ac or H3K27me3 levels at TSSs ±5 Kb. Density heatmap was expanded to TSSs ±20 Kb with same ordering.

지금까지 다양한 ì¢…ë¥˜ì˜ ížˆìŠ¤í†¤ ë³€í˜•ì´ ë°í˜€ì¡Œìœ¼ë©°, ë³€í˜•ì˜ ì¢…ë¥˜ì— ë”°ë¼ ìœ ì „ì²´ì—서 ë¶„í¬í•˜ëŠ” 위치가 다른 것으로 나타났다. H3K27ac와 H3K27me3는 í¬ë¡œë§ˆí‹´ êµ¬ì¡°ì— ë¯¸ì¹˜ëŠ” ì˜í–¥ì´ 대비ë˜ê¸° ë•Œë¬¸ì— ì´ë“¤ ë‘ ë³€í˜•ì€ ë™ì¼í•œ í¬ë¡œë§ˆí‹´ 부위ì—서 함께 ì¼ì–´ë‚˜ì§€ ì•Šì„ ê²ƒìœ¼ë¡œ 예ìƒë˜ë©°, 실제로 유전ìžì™€ ì¸í•¸ì„œì—서 ì´ë“¤ 히스톤 변형 ë¶„í¬ì˜ ì—­ìƒê´€ê´€ê³„ê°€ ë³´ê³ ë˜ì—ˆë‹¤(Wang et al., 2008; Katoh et al., 2018). ë˜í•œ 히스톤 ë³€í˜•ì˜ ì¢…ë¥˜ì— ë”°ë¼ ë¶„í¬ í˜•íƒœë„ ë‹¤ë¥¸ 것으로 ë³´ì´ë©°, ì´ëŠ” Encyclopedia of DNA Elements (ENCODE) 프로ì íŠ¸ì˜ ê²°ê³¼ì—ì„œë„ ì–¸ê¸‰ë˜ì—ˆë‹¤(Landt et al., 2012). ë”°ë¼ì„œ H3K27ac와 H3K27me3ì˜ ê²½ìš°ì²˜ëŸ¼ ê·¸ ë¶„í¬ í˜•íƒœê°€ 다르면 ChIP-seq ë°ì´í„°ì˜ ìƒë¬¼ì •ë³´í•™ì  ë¶„ì„ì„ ìœ„í•´ 히스톤 ë³€í˜•ì´ ì¼ì–´ë‚˜ëŠ” 지역, 즉 peak를 선별할 때, ë¶„ì„ ë°©ë²•ì„ ë‹¤ë¥´ê²Œ 사용해야 í•  것ì´ë©°, ì´ëŠ” 유전체 수준ì—서 히스톤 ë³€í˜•ì„ ì œëŒ€ë¡œ í•´ì„하기 위해 중요한 과정으로 ìƒê°ëœë‹¤.

H3K27 변형 ChIP-seq ë°ì´í„°ì—서 peak 선별 방법 비êµ

H3K27ac와 H3K27me3 ChIP-seq ë°ì´í„° ë¶„ì„ ê³¼ì •ì—서 peak를 ì ì ˆí•˜ê²Œ 선별하기 위하여 ì´ ì„¸ 가지 ì¡°ê±´ì„ ì„ ì •í•˜ê³  비êµí•˜ì˜€ë‹¤(Fig. 2A). 가장 ì¼ë°˜ì ìœ¼ë¡œ 사용ë˜ëŠ” ë¶„ì„ ë„êµ¬ì¸ MACS2와 넓게 ë¶„í¬í•˜ëŠ” 히스톤 ë³€í˜•ì— ì£¼ë¡œ 사용ë˜ëŠ” SICER를 ì„ íƒí•˜ì˜€ìœ¼ë©°, MACS2ì—서는 narrow peaks (narrow) 옵션과 broad peaks (broad) ì˜µì…˜ì„ ë¹„êµí•˜ì˜€ë‹¤. ì„ ë³„ëœ H3K27ac와 H3K27me3 peaks는 ëª¨ë‘ ê°ê°ì˜ 히스톤 ë³€í˜•ì´ ë§Žì´ ë¶„í¬í•˜ëŠ” ë¶€ìœ„ì— ìžë¦¬í•˜ê³  있었다(Fig. 2B). ì´ ë•Œ H3K27acì˜ ê²½ìš°, narrow와 broad는 H3K27acê°€ 특히 ë§Žì´ ë¶„í¬í•˜ëŠ” 밀집 부위를 ìš°ì„ ì ìœ¼ë¡œ peak로 선별하는 반면 SICERì—서는 H3K27acê°€ ë˜ì–´ 있는 부위 ì „ì²´ê°€ 넓게 선별ë˜ì—ˆë‹¤. ì´ëŠ” 고르게 ë¶„í¬í•˜ì§€ 않는 H3K27acì˜ ë¶„í¬ í˜•íƒœì— ì˜í•´ 나타나는 ì°¨ì´ë¡œ 추정ëœë‹¤. 유전체 ì „ì²´ì—서 ì„ ë³„ëœ peaksì˜ ê¸¸ì´ë¥¼ 비êµí•˜ë©´, narrow, broad, SICER 방법 순으로 ê·¸ 길ì´ê°€ ì¦ê°€í•˜ì˜€ë‹¤(Fig. 2C). Narrow와 broad로 선별한 H3K27ac peaksì˜ í‰ê·  길ì´ëŠ” 491 bp와 1,915 bp였으며, ê°™ì€ ë°©ë²•ìœ¼ë¡œ ì„ ë³„ëœ H3K27me3 peaksì˜ ê¸¸ì´(433 bp와 1,686 bp)보다 조금 길었다. 하지만 SICER로 선별할 경우, H3K27me3 peaksì˜ í‰ê·  길ì´(6,036 bp)ê°€ H3K27ac peaksì˜ í‰ê·  길ì´(5,170 bp)보다 길었으며, ì´ëŠ” SICERì— ì˜í•œ peak ì„ ë³„ì´ H3K27me3ì˜ ë„“ì€ ë¶„í¬ í˜•íƒœë¥¼ 잘 ë°˜ì˜í•˜ëŠ” 것으로 í•´ì„í•  수 있다. ë™ì¼í•œ ChIP-seq ë°ì´í„°ë¡œë¶€í„° 길ì´ê°€ 다르게 ì„ ë³„ëœ peaksì˜ ížˆìŠ¤í†¤ 변형 ìˆ˜ì¤€ì„ ë¹„êµí•˜ê¸° 위해 CPM ê°’ì„ ê³„ì‚°í•˜ì˜€ìœ¼ë©°, CPM ê°’ì€ peaksì˜ ê¸¸ì´ì™€ 비례하여 ì¦ê°€í•˜ì˜€ë‹¤(Fig. 2D). CPMì€ peak ë‚´ì— ì¡´ìž¬í•˜ëŠ” readì˜ ìˆ˜ë¥¼ ì „ì²´ read 수로 보정한 값으로, peak ìžì²´ì˜ 길ì´ê°€ ê¸¸ìˆ˜ë¡ read 수가 ì¦ê°€í•˜ê¸° ë•Œë¬¸ì— peak 길ì´ì™€ CPM ëª¨ë‘ ìœ ì‚¬í•œ ê²½í–¥ì„±ì„ ë³´ì´ëŠ” 것으로 ìƒê°ëœë‹¤.

Fig. 2. Peak calling using MACS2 and SICER tools in public histone H3K27ac and H3K27me3 ChIP-seq data. (A) H3K27ac and H3K27me3 peaks were identified using peak caller MACS2 and SICER with three analysis methods. (B) Peaks identified by each method were presented in genome browser of H3K27ac and H3K27me3 using different colors. Length of peaks (C) and counts per million (CPM) values of peaks (D) were graphed in boxplot. Box and whiskers represent interquartile range (IQR) and ±1.5×IQR values from edge of the box, respectively. (E) Signal-to-background ratio (S/B ratio) was calculated by analyzing H3K27ac or H3K27me3 level at each peak. (F) The S/B ratio of H3K27ac or H3K27me3 peaks was compared between three analysis methods. Difference of the S/B ratio was indicated in multiples.

Peak 선별 ë°©ë²•ì˜ ì ì ˆì„±ì„ 파악하기 위해 signal-to-background ratio (S/B ratio)를 계산하였다(Fig. 2E). 히스톤 ë³€í˜•ì´ ë§Žì´ ë¶„í¬í•˜ëŠ” peak를 기준으로 하여 peak로 선별ë˜ì§€ ì•Šì€ ë¶€ìœ„ë¥¼ non-peak regions으로 구분한 후, peak와 non-peak region ë‚´ì— ì¡´ìž¬í•˜ëŠ” read 수를 측정하였다. 측정한 read 수로 peak와 non-peak regionì˜ CPM ê°’ì„ ê³„ì‚°í•˜ì˜€ìœ¼ë©°, peaks와 non-peak regionsì˜ í‰ê·  CPM ê°’ì„ ë¹„êµí•¨ìœ¼ë¡œì¨ S/B ratio를 ë„출하였다. 세 가지 ë¶„ì„ ë°©ë²•ìœ¼ë¡œ 선별한 peaksì—서 S/B ratio를 비êµí•œ ê²°ê³¼, H3K27acì˜ narrow와 broad, 그리고 narrow와 SICER 사ì´ì—서 ê·¸ ë¹„ìœ¨ì€ ê°ê° 2배와 2.5ë°° ì¦ê°€í•˜ì˜€ì§€ë§Œ, H3K27me3는 ê°ê° 7배와 18.8ë°° ì¦ê°€í•˜ì˜€ë‹¤(Fig. 2F). ì´ì²˜ëŸ¼ H3K27me3 ChIP-seq ë°ì´í„°ì˜ S/B ratioê°€ ë¶„ì„ ë°©ë²•ì— ë”°ë¼ í° ì°¨ì´ë¥¼ ë³´ì´ëŠ” ê²ƒì€ H3K27acì— ë¹„í•´ H3K27me3 ë°ì´í„°ê°€ peak 선별 ë°©ë²•ì— ì˜í•´ ë” ë§Žì´ ì˜í–¥ ë°›ì„ ìˆ˜ 있ìŒì„ 시사한다. ë”°ë¼ì„œ 넓게 ë¶„í¬í•˜ëŠ” H3K27me3ì˜ peak는 MACS2ê°€ 아닌 SICER를 ì´ìš©í•˜ì—¬ 선별하는 ê²ƒì´ ì ì ˆí•œ 것으로 ìƒê°ëœë‹¤.

H3K27 변형 peak 선별 ë°©ë²•ì˜ ì ì ˆì„± ê²€ì¦

Public K562 ChIP-seq ë°ì´í„°ë¥¼ ì´ìš©í•˜ì—¬ 비êµí•œ peak 선별 ë°©ë²•ì´ ì ì ˆí•œì§€ 확ì¸í•˜ê¸° 위해 본 연구실ì—서 수행한 K562 control (Con) H3K27ac ChIP-seq ë°ì´í„°ì™€ H3K27me3 ChIP-seq ë°ì´í„°ë¥¼ ë¶„ì„하였다. 2ë²ˆì˜ ë°˜ë³µ 실험으로 ì–»ì€ Con ChIP-seq ë°ì´í„°ëŠ” Spearman ìƒê´€ê´€ê³„ ë¶„ì„ì—서 나타난 것처럼 public ChIP-seq ë°ì´í„°ì™€ ë†’ì€ ìœ ì‚¬ì„±ì„ ë³´ì˜€ë‹¤(Fig. 3A, B). Con ChIP-seq ë°ì´í„°ì—서 선별한 H3K27ac와 H3K27me3 peaks는 히스톤 ë³€í˜•ì´ ë§Žì€ ë¶€ìœ„ì—서 나타났으며, peakì˜ ê¸¸ì´ë„ narrowì—서 SICER 순서로 ì¦ê°€í•˜ì˜€ë‹¤(Fig. 3C). Con ChIP-seq ë°ì´í„°ì˜ peaksì—서 S/B ratio를 비êµí•œ ê²°ê³¼, H3K27ac는 모든 ë¶„ì„ ë°©ë²•ì—서 í° ì°¨ì´ê°€ 나지 ì•Šì€ ë°˜ë©´(1.4~2.6ë°°), H3K27me3는 narrow와 broad, 그리고 narrow와 SICER 사ì´ì—서 ê°ê° 5.4배와 9ë°° ì°¨ì´ë¥¼ 보여주었다(Fig. 3D).

Fig. 3. Peak calling in histone H3K27ac and H3K27me3 ChIP-seq data of control K562 cells. H3K27ac and H3K27me3 ChIP-seq were carried out in K562 control (Con) cells with two replicates (R1 and R2). (A) Scatter plots show correlation of public ChIP-seq data with Con R1 and R2 ChIP-seq data with Spearman correlation coefficients. (B) The correlation coefficients were also measured between H3K27ac and H3K27me3 ChIP-seq data and visualized by a heatmap. (C) Genome browser shows peaks identified by three analysis methods in green rectangles. (D) The S/B ratio of H3K27ac and H3K27me3 peaks was compared between three analysis methods with two replicates. Difference of the S/B ratio was indicated in multiples.

세 가지 방법으로 선별한 peaksì˜ S/B ratio는 H3K27acì— ë¹„í•´ H3K27me3ì—서 í° ì°¨ì´ë¥¼ 보였으며, ì´ëŸ¬í•œ 현ìƒì€ public ë°ì´í„°ì™€ Con ë°ì´í„° 모ë‘ì—서 나타났다. ì´ëŠ” ì§§ì€ ê¸¸ì´ì— ë¶„í¬í•˜ëŠ” H3K27acì— ë¹„í•´ 긴 ê±°ë¦¬ì— ë„“ê²Œ ë¶„í¬í•˜ëŠ” H3K27me3ê°€ ChIP-seq ë°ì´í„° ë¶„ì„ ë°©ë²•ì— ì˜í•´ ë” ë§Žì´ ì˜í–¥ ë°›ìŒì„ ì˜ë¯¸í•˜ë¯€ë¡œ 히스톤 ë³€í˜•ì˜ ë¶„í¬ í˜•íƒœì— ë”°ë¼ ì ì ˆí•œ peak 선별 ë°©ë²•ì„ ì‚¬ìš©í•˜ëŠ” ê²ƒì´ í•„ìš”í•œ 것 같다. 아울러 publicê³¼ Con ChIP-seq ë°ì´í„° 모ë‘ì—서 H3K27acì˜ S/B ratioê°€ H3K27me3보다 높았는ë°, ì´ëŠ” ChIP ì‹¤í—˜ì— ì‚¬ìš©í•œ í•­ì²´ì˜ íŠ¹ì´ì„±ê³¼ ê´€ë ¨ëœ ê²ƒìœ¼ë¡œ 추정ëœë‹¤. Fig. 1A와 Fig. 3Cì—서 보여지는 것처럼 H3K27me3 ChIP-seq ë°ì´í„°ì˜ noise signalì´ H3K27ac ë°ì´í„°ì— 비해 높게 나타나며, ë†’ì€ noise는 ê²°ê³¼ì ìœ¼ë¡œ non-peak CPM ê°’ì„ ì¦ê°€ì‹œí‚¨ë‹¤.

Sequencing depthì— ë”°ë¥¸ H3K27 ë³€í˜•ì˜ ChIP-seq ë°ì´í„° 비êµ

ChIP-seq ë¼ì´ë¸ŒëŸ¬ë¦¬ë¡œ NGS ì‹œí€€ì‹±ì„ ìˆ˜í–‰í•˜ë©´ ì¼ì •한 길ì´ì˜ reads를 얻게 ë˜ëŠ”ë°, readì˜ ê°œìˆ˜ê°€ ë§Žì„ìˆ˜ë¡ sequencing depth는 ì¦ê°€í•œë‹¤. 하지만 시퀀싱 비용과 ë¶„ì„ ì‹œê°„ì´ ì¦ê°€í•˜ëŠ” 단ì ë„ 있다. ë”°ë¼ì„œ ë°ì´í„°ë¥¼ 효율ì ìœ¼ë¡œ ë¶„ì„하기 위해 ì ì ˆí•œ 길ì´ì™€ ê°œìˆ˜ì˜ read를 얻어야 한다. ë¶„í¬ í˜•íƒœê°€ 다른 H3K27ac와 H3K27me3ì˜ ChIP-seq ë°ì´í„° ë¶„ì„ì— ì ì ˆí•œ sequencing depth를 알아보기 위해 Con ChIP-seq ë°ì´í„°ì˜ ì „ì²´ read 수를 네 가지 기준(15 M, 30 M, 60 M, 120 M)으로 제한하고, ì´í›„ ë¶„ì„ì„ ìˆ˜í–‰í•˜ì˜€ë‹¤(Fig. 4A). Genome browserì—서 ë³´ë©´ H3K27ac는 read 수와 ìƒê´€ì—†ì´ 유사한 ë¶„í¬ í˜•íƒœë¥¼ 나타내지만, H3K27me3는 60 M ì´ìƒì˜ read 수ì—서 길고 ê· ì¼í•œ ë¶„í¬ í˜•íƒœë¥¼ 보여준다(Fig. 4B). Sequencing depth와 peak 선별 사ì´ì˜ 관계를 조사하기 위해 H3K27acì˜ peak는 broad 방법으로, 그리고 H3K27me3ì˜ peak는 SICER 방법으로 선별하였다. H3K27ac는 60 M와 120 M readsì—서 30 Mì— ë¹„í•´ ê°ê° 1.9배와 3.6ë°° ë§Žì€ peaksê°€ 선별ë˜ì—ˆê³ , H3K27me3는 read 수와 ìƒê´€ì—†ì´ 유사한 ê°œìˆ˜ì˜ peaksê°€ 선별ë˜ì—ˆë‹¤(Fig. 4C). 네 가지 ê¸°ì¤€ì˜ read ìˆ˜ì— ëŒ€í•˜ì—¬ peakì˜ S/B ratio를 비êµí•˜ì˜€ì„ 때 H3K27ac와 H3K27me3ì—서 15 M와 120 M 사ì´ì— 1.9ë°°~2.6ë°°ì˜ ì°¨ì´ë¥¼ 보였으나, ì´ëŠ” peak 선별 ë°©ë²•ì— ëŒ€í•œ S/B ratioì˜ ê²©ì°¨ë³´ë‹¤ 작다(Fig. 4D). H3K27acì—서 ì„ ë³„ëœ peaksì˜ ìœ„ì¹˜ë¥¼ 비êµí•˜ê¸° 위해 중첩 여부를 ë¶„ì„한 ê²°ê³¼, 60 M와 120 Mì—서 새로운 peaksê°€ ë§Žì´ ì¶”ê°€ë˜ì—ˆìœ¼ë©°, 특히 120 Mì—서 700 bp ì´í•˜ì˜ peaksì˜ ì¦ê°€ê°€ ë‘드러진다(Fig. 4E). ì´ëŠ” ë§Žì€ read ìˆ˜ì— ì˜í•´ 새로 ì„ ë³„ëœ peaksê°€ 대부분 ì§§ì€ ê¸¸ì´ìž„ì„ ì•Œ 수 있다. 반면 H3K27me3는 15 Mì—서 120 M까지 peaksì˜ ëŒ€ë¶€ë¶„ì´ ì¤‘ì²©ë˜ë©°, read 수가 ì¦ê°€í• ìˆ˜ë¡ 1~4 Kb 사ì´ì˜ peaksê°€ ê°ì†Œí•˜ê³ , 10~50 Kb 사ì´ì˜ peaksê°€ ì¦ê°€í•œë‹¤(Fig. 4F). Fig. 4Bì—서 read ìˆ˜ì— ë”°ë¼ ì„ ë³„ëœ peaks를 H3K27ac와 H3K27me3ì˜ ë¶„í¬ ìˆ˜ì¤€ê³¼ 비êµí•˜ë©´, H3K27ac 120 Mì—서 새로 ì„ ë³„ëœ peaks는 ë³€í˜•ì´ ì¼ì–´ë‚˜ëŠ” 부위를 제대로 ë°˜ì˜í•˜ì§€ 못하지만 H3K27me3ê°€ 넓게 ë¶„í¬í•˜ëŠ” ì˜ì—­ì€ 120 Mì—서 peak로 ì ì ˆížˆ 선별ë˜ì—ˆë‹¤. ë”°ë¼ì„œ 히스톤 ë³€í˜•ì˜ ì¢…ë¥˜ì— ë”°ë¼ ë†’ì€ sequencing depthê°€ 오히려 false-positive peak ì„ ë³„ì„ ì´ˆëž˜í•  수 있는 것으로 ìƒê°ë˜ë©°, H3K27me3처럼 ë„“ì€ ë¶€ìœ„ì— ë¶„í¬í•˜ëŠ” 히스톤 ë³€í˜•ì€ sequencing depthì˜ ì¦ê°€ê°€ ì ì ˆí•œ peak ì„ ë³„ì— ê¸ì •ì ìœ¼ë¡œ 작용하는 것으로 ë³´ì¸ë‹¤.

Fig. 4. Analysis of histone H3K27ac and H3K27me3 ChIP-seq data in different sequencing depth. H3K27ac and H3K27me3 ChIP-seq data of control K562 cells (Con) were re-generated with 15, 30, 60 or 120 million (M) read counts. (A) The total read counts of Con ChIP-seq data were listed in a table. (B) Distribution of histone H3K27ac and H3K27me3 and peaks were visualized in genome browser with different read counts. Newly identified peaks in 120 M for H3K27ac were highlighted with red shadow. (C) The number of identified peaks was graphed in 15 M, 30 M, 60 M and 120 M. (D) The S/B ratio of peaks was compared with different read counts. Difference of the S/B ratio was indicated in multiples. Histone H3K27ac (E) and H3K27me3 peaks (F) identified in different read counts were overlapped and visualized by venn diagram (left). The number of peaks was graphed according to the length of them (right).

본 연구ì—서 ë¶„ì„한 Con ChIP-seq ë°ì´í„°ëŠ” paired-end ì‹œí€€ì‹±ì„ í†µí•´ 확보한 ë°ì´í„°ë¡œ, 2ê°œì˜ readsê°€ 1ê°œì˜ fragmentì—서 얻어지기 ë•Œë¬¸ì— Fig. 4ì—서 언급한 15~ 120 Mì˜ read 수는 7.5~60 Mì˜ fragments를 ë°˜ì˜í•œë‹¤. 그러나 single-end 시퀀싱으로 ì–»ì€ ChIP-seq ë°ì´í„°ëŠ” 1ê°œì˜ readê°€ 1ê°œì˜ fragment를 ë°˜ì˜í•˜ë¯€ë¡œ NGS ë°ì´í„°ì˜ sequencing depth는 시퀀싱 ë°©ë²•ì— ë”°ë¼ ë¹„êµí•´ì•¼ 한다. ENCODE ê°€ì´ë“œë¼ì¸ì— 따르면 mammalian cellsì—서 유ì˜ë¯¸í•œ ChIP-seq ë°ì´í„°ë¥¼ 확보하기 위해 최소 1~2천만개(10~20 M) ì´ìƒì˜ uniquely mapped readsê°€ 필요하다(Landt et al., 2012). 넓게 ë¶„í¬í•˜ëŠ” 히스톤 ë³€í˜•ì˜ ê²½ìš° sequencing depthê°€ 높ì„ìˆ˜ë¡ ë°ì´í„°ì˜ ì§ˆì  ìˆ˜ì¤€ì´ ì¦ê°€í•˜ëŠ” ê²½í–¥ì„ ë³´ì˜€ëŠ”ë°, ì´ëŠ” sequencing depthì— ë”°ë¼ ë‹¤ì–‘í•œ 히스톤 ë³€í˜•ì˜ ChIP-seq ë°ì´í„°ë¥¼ 비êµí•œ 연구 결과와 ì¼ì¹˜í•œë‹¤(Jeon et al., 2020). ë”°ë¼ì„œ ì¢ê²Œ ë¶„í¬í•˜ëŠ” H3K27ac는 paired-end 기준 30 Mì˜ readsë§Œ ì–»ì–´ë„ ìœ ì˜ë¯¸í•œ ChIP-seq ë°ì´í„°ë¥¼ 확보할 수 있지만, 넓게 ë¶„í¬í•˜ëŠ” H3K27me3는 ì ì–´ë„ 60 M ì´ìƒì˜ readsê°€ 필요한 것으로 ìƒê°ëœë‹¤. ë˜í•œ read ìˆ˜ì— ë”°ë¥¸ S/B ratio ì°¨ì´ëŠ” peak 선별 ë°©ë²•ì— ë”°ë¥¸ ì°¨ì´ë³´ë‹¤ 작게 나타났으며, H3K27ac 120 Mì—서 S/B ratioê°€ 15 M보다 2.6ë°° 높았지만 ë¶€ì ì ˆí•œ peaksê°€ 함께 선별ë˜ì—ˆë˜ 것으로 ë³´ì•„ S/B ratio는 ë°ì´í„° ìžì²´ì˜ ì§ˆì  ìˆ˜ì¤€ 비êµë³´ë‹¤ëŠ” ë¶„ì„ ë°©ë²•ì˜ ë¹„êµì— 활용하는 ê²ƒì´ ì ì ˆí•˜ë‹¤ê³  사료ëœë‹¤.

본 연구 결과는 유전체 수준ì—서 히스톤 H3K27ac와 H3K27me3ì˜ ë¶„í¬ ê¸¸ì´ê°€ 다르며, 넓게 ë¶„í¬í•˜ëŠ” H3K27me3는 ì¢ê²Œ ì¼ì–´ë‚˜ëŠ” H3K27acì— ë¹„í•´ peaks 선별 ë°©ë²•ì´ ì¤‘ìš”í•¨ì„ ë³´ì—¬ì¤€ë‹¤. ë˜í•œ sequencing depthê°€ H3K27acì˜ ë°ì´í„° ë¶„ì„ì— ë³„ ì˜í–¥ì„ 미치지 않지만, 너무 ë†’ì€ sequencing depth는 peak 선별 과정ì—서 부정ì ì¸ ì˜í–¥ì„ 미치는 것으로 나타났다. 반면 H3K27me3는 sequencing depthê°€ 높ì„ìˆ˜ë¡ ChIP-seq ë°ì´í„°ì˜ ì§ˆì  ìˆ˜ì¤€ì´ ì¦ê°€í•˜ì˜€ë‹¤. ë”°ë¼ì„œ 히스톤 ë³€í˜•ì— ëŒ€í•œ ChIP-seq ì‹¤í—˜ì„ ìˆ˜í–‰í•  때 히스톤 ë³€í˜•ì´ ë¶„í¬í•˜ëŠ” 형태를 고려하여 sequencing depth를 결정하고, ë¶„ì„ ë°©ë²•ì„ ì„ íƒí•˜ëŠ” ê²ƒì´ í•„ìš”í•˜ë‹¤ê³  여겨진다. ì´ë ‡ê²Œ 얻어진 결과는 정확한 ìƒë¬¼í•™ì  정보를 제공하고 나아가 ì§ˆë³‘ì˜ ì§„ë‹¨ ë° ì¹˜ë£Œì œ ê°œë°œì— í™œìš©ë  ìˆ˜ ìžˆì„ ê²ƒì´ë‹¤.

Abbreviations
15~120 M

15 million-120 million

ChIP

Chromatin immuniprecipitation

ChIP-seq

Chromatin immuniprecipitation-sequencing

Con

Control

CPM

Counts per million

ENCODE

Encyclopedia of DNA elements

EZH2

Enhancer of zeste 2 polycomb epressive complex 2

GEO

Gene expression omnibus

H3K27ac

Histone H3K27 acetylation

H3K27me3

Histone H3K27 tri-methylation

H3K36me3

Histone H3K36 tri-methylation

H3K4me1

Histone H3K4 mono-methylation

H3K4me3

Histone H3K4 tri-methylation

H3K9me3

Histone H3K9 tri-methylation

HDAC

Histone deacetylase

IGV

Integrative genomics viewer

MAPQ

Mapping quality

MNase

Micrococcal nuclease

NGS

Next-generation sequencing

S/B ratio

Signal-to-background ratio

TE

Tris-EDTA

TSSs

Transcription start sites

ACKNOWLEDGEMENT

This study was supported by the 『BK21 Four Program〠of Pusan National University.

CONFLICT OF INTEREST

The authors have declared no conflict of interest.

References
  1. Bannister AJ, Kouzarides T. Regulation of chromatin by histone modifications. Cell Res. 2011. 21: 381-395.
    Pubmed KoreaMed CrossRef
  2. Bolger AM, Lohse M, Usadel B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 2014. 30: 2114-2120.
    Pubmed KoreaMed CrossRef
  3. Bowman SK, Deaton AM, Domingues HDomingues H et al. H3K27 modifications define segmental regulatory domains in the Drosophila bithorax complex. eLife. 2014. 3: e02833.
    Pubmed KoreaMed CrossRef
  4. Cao R, Wang L, Wang HWang H et al. Role of histone H3 lysine 27 methylation in Polycomb-group silencing. Science. 2002. 298: 1039-1043.
    Pubmed CrossRef
  5. Chi P, Allis CD, Wang GG. Covalent histone modifications-miswritten, misinterpreted and mis-erased in human cancers. Nat Rev Cancer. 2010. 10: 457-469.
    Pubmed KoreaMed CrossRef
  6. Chrysanthou S, Tang Q, Lee JLee J et al. The DNA dioxygenase Tet1 regulates H3K27 modification and embryonic stem cell biology independent of its catalytic activity. Nucleic Acids Res. 2022. 50: 3169-3189.
    Pubmed KoreaMed CrossRef
  7. Cutter AR, Hayes JJ. A brief review of nucleosome structure. FEBS Lett. 2015. 589: 2914-2922.
    Pubmed KoreaMed CrossRef
  8. Fernandes MT, Almeida-Lousada H, Castelo-Branco P. Histone modifications in diseases. 2020. pp. 1-15. Academic Press. USA.
    CrossRef
  9. Fiskus W, Wang Y, eekumar A Sreekumar A Sr et al. Combined epigenetic therapy with the histone methyltransferase EZH2 inhibitor 3-deazaneplanocin A and the histone deacetylase inhibitor panobinostat against human AML cells. Blood. 2009. 114: 2733-2743.
    Pubmed KoreaMed CrossRef
  10. Fujii S, Ochiai A. Enhancer of zeste homolog 2 downregulates E-cadherin by mediating histone H3 methylation in gastric cancer cells. Cancer Sci. 2008. 99: 738-746.
    Pubmed CrossRef
  11. Jeon H, Lee H, Kang B, Jang I, Roh TY. Comparative analysis of commonly used peak calling programs for ChIP-Seq analysis. Genomics Inform. 2020. 18: e42.
    Pubmed KoreaMed CrossRef
  12. Kang J, Kim YW, Park S, Kang Y, Kim A. Multiple CTCF sites cooperate with each other to maintain a TAD for enhancer-promoter interaction in the β-globin locus. FASEB J. 2021a. 35: e21768.
    Pubmed KoreaMed CrossRef
  13. Kang Y, Kang J, Kim A. Histone H3K4me1 strongly activates the DNase I hypersensitive sites in super-enhancers than those in typical enhancers. Biosci Rep. 2021b. 41: BSR20210691.
    Pubmed KoreaMed CrossRef
  14. Kang Y, Kim YW, Kang J, Kim A. Histone H3K4me1 and H3K27ac play roles in nucleosome eviction and eRNA transcription, respectively, at enhancers. FASEB J. 2021c. 35: e21781.
    Pubmed KoreaMed CrossRef
  15. Katoh N, Kuroda K, Tomikawa JTomikawa J et al. Reciprocal changes of H3K27ac and H3K27me3 at the promoter regions of the critical genes for endometrial decidualization. Epigenomics. 2018. 10: 1243-1257.
    Pubmed CrossRef
  16. Khan A, Mathelier A. Intervene: a tool for intersection and visualization of multiple gene or genomic region sets. BMC Bioinformatics. 2017. 18: 287.
    Pubmed KoreaMed CrossRef
  17. Kim J, Kang J, Kim YW, Kim A. The human β-globin enhancer LCR HS2 plays a role in forming a TAD by activating chromatin structure at neighboring CTCF sites. FASEB J. 2021. 35: e21669.
    Pubmed KoreaMed CrossRef
  18. Kim YW, Kang Y, Kang J, Kim A. GATA-1-dependent histone H3K27 acetylation mediates erythroid cell-specific chromatin interaction between CTCF sites. FASEB J. 2020. 34: 14736-14749.
    Pubmed CrossRef
  19. Kim YW, Kim A. Characterization of histone H3K27 modifications in the β-globin locus. Biochem Biophys Res Commun. 2011. 405: 210-215.
    Pubmed CrossRef
  20. Kuo MH, Allis CD. In vivo cross-linking and immunoprecipitation for studying dynamic Protein:DNA associations in a chromatin environment. Methods. 1999. 19: 425-433.
    Pubmed CrossRef
  21. Landt SG, Marinov GK, Kundaje AKundaje A et al. ChIP-seq guidelines and practices of the ENCODE and modENCODE consortia. Genome Res. 2012. 22: 1813-1831.
    Pubmed KoreaMed CrossRef
  22. Langmead B, Salzberg SL. Fast gapped-read alignment with Bowtie 2. Nat Methods. 2012. 9: 357-359.
    Pubmed KoreaMed CrossRef
  23. Lauberth SM, Nakayama T, Wu XWu X et al. H3K4me3 interactions with TAF3 regulate preinitiation complex assembly and selective gene activation. Cell. 2013. 152: 1021-1036.
    Pubmed KoreaMed CrossRef
  24. Lee HA, Cho HM, Lee DY, Kim KC, Han HS, Kim IK. Tissue-specific upregulation of angiotensin-converting enzyme 1 in spontaneously hypertensive rats through histone code modifications. Hypertension. 2012. 59: 621-626.
    Pubmed CrossRef
  25. Marzi SJ, Leung SK, Ribarska TRibarska T et al. A histone acetylome-wide association study of Alzheimer's disease identifies disease-associated H3K27ac differences in the entorhinal cortex. Nat Neurosci. 2018. 21: 1618-1627.
    Pubmed CrossRef
  26. McErlean P, Kelly A, Dhariwal JDhariwal J et al. Profiling of H3K27Ac reveals the influence of asthma on the epigenome of the airway epithelium. Front Genet. 2020. 11: 585746.
    Pubmed KoreaMed CrossRef
  27. Min J, Zhang Y, Xu RM. Structural basis for specific binding of Polycomb chromodomain to histone H3 methylated at Lys 27. Genes Dev. 2003. 17: 1823-1828.
    Pubmed KoreaMed CrossRef
  28. Ougolkov AV, Bilim VN, Billadeau DD. Regulation of pancreatic tumor cell proliferation and chemoresistance by the histone methyltransferase enhancer of zeste homologue 2. Clin Cancer Res. 2008. 14: 6790-6796.
    Pubmed KoreaMed CrossRef
  29. Ramírez F, Ryan DP, Grüning BGrüning B et al. deepTools2: a next generation web server for deep-sequencing data analysis. Nucleic Acids Res. 2016. 44: W160-W165.
    Pubmed KoreaMed CrossRef
  30. Thorvaldsdóttir H, Robinson JT, Mesirov JP. Integrative Genomics Viewer (IGV): high-performance genomics data visualization and exploration. Brief Bioinform. 2013. 14: 178-192.
    Pubmed KoreaMed CrossRef
  31. Vermeulen M, Mulder KW, Denissov SDenissov S et al. Selective anchoring of TFIID to nucleosomes by trimethylation of histone H3 lysine 4. Cell. 2007. 131: 58-69.
    Pubmed CrossRef
  32. Wang Y, Hou C, Wisler JWisler J et al. Elevated histone H3 acetylation is associated with genes involved in T lymphocyte activation and glutamate decarboxylase antibody production in patients with type 1 diabetes. J Diabetes Investig. 2019. 10: 51-61.
    Pubmed KoreaMed CrossRef
  33. Wang Z, Zang C, Rosenfeld JARosenfeld JA et al. Combinatorial patterns of histone acetylations and methylations in the human genome. Nat Genet. 2008. 40: 897-903.
    Pubmed KoreaMed CrossRef
  34. Wolffe AP, Guschin D. Review: chromatin structural features and targets that regulate transcription. J Struct Biol. 2000. 129: 102-122.
    Pubmed CrossRef
  35. Yu J, Cao Q, Mehra RMehra R et al. Integrative genomics analysis reveals silencing of β-adrenergic signaling by polycomb in prostate cancer. Cancer Cell. 2007. 12: 419-431.
    Pubmed CrossRef
  36. Zang C, Schones DE, Zeng C, Cui K, Zhao K, Peng W. A clustering approach for identification of enriched domains from histone modification ChIP-Seq data. Bioinformatics. 2009. 25: 1952-1958.
    Pubmed KoreaMed CrossRef
  37. Zhang L, Xiong D, Liu QLiu Q et al. Genome-wide histone H3K27 acetylation profiling identified genes correlated with prognosis in papillary thyroid carcinoma. Front Cell Dev Biol. 2021. 9: 682561.
    Pubmed KoreaMed CrossRef
  38. Zhang Y, Liu T, Meyer CAMeyer CA et al. Model-based analysis of ChIP-Seq (MACS). Genome Biol. 2008. 9: R137.
    Pubmed KoreaMed CrossRef