]> git.donarmstrong.com Git - samtools.git/blob - bamtk.c
f12f9003bdb858c0d031ff4de87a437b47e29342
[samtools.git] / bamtk.c
1 #include <stdio.h>
2 #include <unistd.h>
3 #include "bam.h"
4
5 #ifndef PACKAGE_VERSION
6 #define PACKAGE_VERSION "0.1.3-2"
7 #endif
8
9 int bam_taf2baf(int argc, char *argv[]);
10 int bam_pileup(int argc, char *argv[]);
11 int bam_merge(int argc, char *argv[]);
12 int bam_index(int argc, char *argv[]);
13 int bam_sort(int argc, char *argv[]);
14 int bam_tview_main(int argc, char *argv[]);
15 int bam_mating(int argc, char *argv[]);
16 int bam_rmdup(int argc, char *argv[]);
17 int bam_flagstat(int argc, char *argv[]);
18
19 int faidx_main(int argc, char *argv[]);
20 int glf3_view_main(int argc, char *argv[]);
21
22 static int view_aux(const bam1_t *b, void *data)
23 {
24         bam_view1((bam_header_t*)data, b);
25         return 0;
26 }
27 static int view_auxb(const bam1_t *b, void *data)
28 {
29         bam_write1((bamFile)data, b);
30         return 0;
31 }
32
33 int bam_view(int argc, char *argv[])
34 {
35         bamFile fp, fpout = 0;
36         bam_header_t *header;
37         bam1_t *b;
38         int ret, c, is_bam = 0, is_header = 0, is_headeronly = 0;
39         while ((c = getopt(argc, argv, "bhH")) >= 0) {
40                 switch (c) {
41                 case 'b': is_bam = 1; break;
42                 case 'h': is_header = 1; break;
43                 case 'H': is_headeronly = 1; break;
44                 default: fprintf(stderr, "Unrecognized option: -%c\n", c); return 1;
45                 }
46         }
47         if (argc == optind) {
48                 fprintf(stderr, "Usage: samtools view [-bhH] <in.bam> [<region> [...]]\n");
49                 return 1;
50         }
51         fp = strcmp(argv[optind], "-")? bam_open(argv[optind], "r") : bam_dopen(fileno(stdin), "r");
52         assert(fp);
53         header = bam_header_read(fp);
54         if (header == 0) {
55                 fprintf(stderr, "[bam_view] fail to read the BAM header. Abort!\n");
56                 return 1;
57         }
58         if (is_bam) {
59                 assert(fpout = bam_dopen(fileno(stdout), "w"));
60                 bam_header_write(fpout, header);
61         }
62         if (is_header || is_headeronly) {
63                 int i, c;
64                 c = header->text[header->l_text-1];
65                 header->text[header->l_text-1] = 0;
66                 printf("%s", header->text);
67                 if (c) putchar(c);
68                 header->text[header->l_text-1] = c;
69                 for (i = 0; i < header->n_targets; ++i)
70                         printf("@SQ\tSN:%s\tLN:%d\n", header->target_name[i], header->target_len[i]);
71                 if (is_headeronly) {
72                         bam_header_destroy(header);
73                         bam_close(fp);
74                         return 0;
75                 }
76         }
77         if (optind + 1 == argc) {
78                 b = (bam1_t*)calloc(1, sizeof(bam1_t));
79                 while ((ret = bam_read1(fp, b)) >= 0) bam_view1(header, b);
80                 if (ret < -1) fprintf(stderr, "[bam_view] truncated file? Continue anyway. (%d)\n", ret);
81                 free(b->data); free(b);
82         } else {
83                 int i;
84                 bam_index_t *idx;
85                 idx = bam_index_load(argv[optind]);
86                 for (i = optind + 1; i < argc; ++i) {
87                         int tid, beg, end;
88                         bam_parse_region(header, argv[i], &tid, &beg, &end);
89                         if (tid < 0) {
90                                 fprintf(stderr, "[bam_view] fail to get the reference name. Abort!\n");
91                                 return 1;
92                         }
93                         if (is_bam) bam_fetch(fp, idx, tid, beg, end, fpout, view_auxb);
94                         else bam_fetch(fp, idx, tid, beg, end, header, view_aux);
95                 }
96                 bam_index_destroy(idx);
97         }
98         bam_header_destroy(header);
99         bam_close(fp);
100         if (is_bam) bam_close(fpout);
101         return 0;
102 }
103
104 int bam_tagview(int argc, char *argv[])
105 {
106         bamFile fp;
107         bam_header_t *header;
108         bam1_t *b;
109         char tag[2];
110         int ret;
111         if (argc < 3) {
112                 fprintf(stderr, "Usage: samtools tagview <in.bam> <tag>\n");
113                 return 1;
114         }
115         fp = strcmp(argv[1], "-")? bam_open(argv[1], "r") : bam_dopen(fileno(stdin), "r");
116         assert(fp);
117         header = bam_header_read(fp);
118         if (header == 0) {
119                 fprintf(stderr, "[bam_view] fail to read the BAM header. Abort!\n");
120                 return 1;
121         }
122         tag[0] = argv[2][0]; tag[1] = argv[2][1];
123         b = (bam1_t*)calloc(1, sizeof(bam1_t));
124         while ((ret = bam_read1(fp, b)) >= 0) {
125                 uint8_t *d = bam_aux_get(b, tag);
126                 if (d) {
127                         printf("%s\t%d\t", bam1_qname(b), b->core.flag);
128                         if (d[0] == 'Z' || d[0] == 'H') printf("%s\n", bam_aux2Z(d));
129                         else if (d[0] == 'f') printf("%f\n", bam_aux2f(d));
130                         else if (d[0] == 'd') printf("%lf\n", bam_aux2d(d));
131                         else if (d[0] == 'A') printf("%c\n", bam_aux2A(d));
132                         else if (d[0] == 'c' || d[0] == 's' || d[0] == 'i') printf("%d\n", bam_aux2i(d));
133                         else if (d[0] == 'C' || d[0] == 'S' || d[0] == 'I') printf("%u\n", bam_aux2i(d));
134                         else printf("\n");
135                 }
136         }
137         if (ret < -1) fprintf(stderr, "[bam_view] truncated file? Continue anyway. (%d)\n", ret);
138         free(b->data); free(b);
139         bam_header_destroy(header);
140         bam_close(fp);
141         return 0;
142 }
143
144 static int usage()
145 {
146         fprintf(stderr, "\n");
147         fprintf(stderr, "Program: samtools (Tools for alignments in the SAM format)\n");
148         fprintf(stderr, "Version: %s\n\n", PACKAGE_VERSION);
149         fprintf(stderr, "Usage:   samtools <command> [options]\n\n");
150         fprintf(stderr, "Command: import      import from the text format\n");
151         fprintf(stderr, "         view        export to the text format\n");
152         fprintf(stderr, "         sort        sort alignment file\n");
153         fprintf(stderr, "         merge       merge multiple sorted alignment files\n");
154         fprintf(stderr, "         pileup      generate pileup output\n");
155         fprintf(stderr, "         faidx       index/extract FASTA\n");
156 #ifndef _NO_CURSES
157         fprintf(stderr, "         tview       text alignment viewer\n");
158 #endif
159         fprintf(stderr, "         index       index alignment\n");
160         fprintf(stderr, "         fixmate     fix mate information\n");
161         fprintf(stderr, "         rmdup       remove PCR duplicates\n");
162         fprintf(stderr, "         glfview     print GLFv2 file\n");
163         fprintf(stderr, "         flagstat    simple stats\n");
164         fprintf(stderr, "\n");
165         return 1;
166 }
167
168 int main(int argc, char *argv[])
169 {
170         if (argc < 2) return usage();
171         if (strcmp(argv[1], "view") == 0) return bam_view(argc-1, argv+1);
172         else if (strcmp(argv[1], "import") == 0) return bam_taf2baf(argc-1, argv+1);
173         else if (strcmp(argv[1], "pileup") == 0) return bam_pileup(argc-1, argv+1);
174         else if (strcmp(argv[1], "merge") == 0) return bam_merge(argc-1, argv+1);
175         else if (strcmp(argv[1], "sort") == 0) return bam_sort(argc-1, argv+1);
176         else if (strcmp(argv[1], "index") == 0) return bam_index(argc-1, argv+1);
177         else if (strcmp(argv[1], "faidx") == 0) return faidx_main(argc-1, argv+1);
178         else if (strcmp(argv[1], "fixmate") == 0) return bam_mating(argc-1, argv+1);
179         else if (strcmp(argv[1], "rmdup") == 0) return bam_rmdup(argc-1, argv+1);
180         else if (strcmp(argv[1], "glfview") == 0) return glf3_view_main(argc-1, argv+1);
181         else if (strcmp(argv[1], "flagstat") == 0) return bam_flagstat(argc-1, argv+1);
182         else if (strcmp(argv[1], "tagview") == 0) return bam_tagview(argc-1, argv+1);
183 #ifndef _NO_CURSES
184         else if (strcmp(argv[1], "tview") == 0) return bam_tview_main(argc-1, argv+1);
185 #endif
186         else {
187                 fprintf(stderr, "[main] unrecognized command '%s'\n", argv[1]);
188                 return 1;
189         }
190         return 0;       
191 }