Bioinformatics
[Bowtie2] RNA-seq data mapping 하기
김예비석사
2022. 10. 2. 20:38
reference genome 설정
bowtie2-build reference_genome.fasta reference
reference genome의 fasta file을 넣고 변수명을 reference라고 지정
(변수명은 자유로 변경 가능)
aligniing reads(paired-end)
bowtie2 -x reference -1 fastq_file_1.fq -2 fastq_file_2.fq -S mapping_output.sam
-x: reference genome file
-1: first fastq file
-2: second fastq file
-S: output file을 sam file로 지정
paired-end면 보통 다운로드 받을 때 split된 형태로 _1.fq _2.fq 형태로 다운로드 되는데
그것을 순서대로 넣어주면 된다.
다양한 많은 parameter가 있지만 여기선 꼭 설정해줘야하는 기본만 서술하였다.
sam to bam
samtools view -bS output.sam > output.bam
align하는 코드와 함께 쓸 수도 있다.
sam file로 놔둬도 되지만 용량이 큰 관계로 binary file인 bam파일로 변환을 많이 한다.
sam은 우리가 읽을 수 있지만 bam은 읽을 수 없다는 큰 차이가 있다.