]> git.donarmstrong.com Git - biopieces.git/blobdiff - bp_scripts/QA_Illumina_report.rb
refactoring of assemble_pairs
[biopieces.git] / bp_scripts / QA_Illumina_report.rb
index 3139d49127b1e3a796c4e30cc819f3314df94f14..6e0ba0a4c10c9ec695daf0c81dd1fb0c5f591c6c 100755 (executable)
@@ -66,19 +66,19 @@ scores_bin_file                = File.join(tmpdir, 'scores_bin.png')
 STDERR.puts "Analyzing sequences ... "
 
 system(
-  "read_fastq -i #{seq_file} |
+  "read_fastq -e base_33 -i #{seq_file} |
    progress_meter |
    analyze_vals -k SEQ -o #{analyze_vals_file} |
    trim_seq -l 3 -m 25 |
-   grab -e 'SEQ_LEN > 0' |
+   grab -e 'SEQ_LEN > 20' |
    analyze_vals -k SEQ -o #{analyze_vals_trim_file} |
-   find_adaptor -c 12 -l 6 -L 6 -f ACACGACGCTCTTCCGATCT -r AGATCGGAAGAGCACACGTC |
+   find_adaptor -l 6 -L 6 -f ACACGACGCTCTTCCGATCT -r AGATCGGAAGAGCACACGTC |
    clip_adaptor |
    grab -e 'SEQ_LEN > 0' |
    analyze_vals -k SEQ -o #{analyze_vals_trim_noadapt_file} |
    plot_distribution -k SEQ_LEN -T 'Sequence length distribution' -X 'Sequence length' -t png -o #{lendist_file} |
    plot_scores -c -t png -o #{scores_file} |
-   plot_nucleotide_distribution -t png -o #{nucdist_file} |
+   plot_nucleotide_distribution -c -t png -o #{nucdist_file} |
    bin_vals -k SEQ_LEN -b 25 |
    plot_distribution -T '25 bases bin sequence length distribution' -X 'Sequence length' -k SEQ_LEN_BIN -t png -o #{lendist_bin_file} |
    mean_scores |