]> git.donarmstrong.com Git - resume.git/blob - don_armstrong_resume.org
update resume to include ginkgo bioworks pieces
[resume.git] / don_armstrong_resume.org
1 #+OPTIONS: ^:nil
2 #+OPTIONS: toc:nil
3 #+OPTIONS: auto-id:f
4 #+TITLE: Resume
5 #+AUTHOR: Don L. Armstrong
6 #+LATEX_CMD: xelatex
7 #+LATEX_CLASS: dlaresume
8 # #+LATEX_CLASS_OPTIONS: [10pt,breaklinks]
9
10 * Experience
11 ** Team Lead Data Engineering at Ginkgo Bioworks \hfill 2022--Present
12 + Lead and manged team of data engineers, system administrators,
13   statisticians, bioinformaticians, and scientists at the PhD level
14   working within the AgBio unit of Ginkgo Bioworks.
15 + Mentored and coached team members in data science, bioinformatics,
16   data engineering, and statistics.
17 + Key leadership role in successful merger of AgBio unit with Ginkgo,
18   including all relevant R&D business applications and data-adjacent
19   systems.
20 ** Team Lead Data Engineering at Bayer Crop Science \hfill 2018--2022
21 + Hired, managed, and developed team of 5+ Data Engineers, Systems
22   Administrators, and Business Analysts working within the Biologics
23   R&D unit of Bayer Crop Science enabling data capture, data
24   integration, and operationalization of data analysis pipelines
25 + Developed and supervised implementation of data capture,
26   integration, and analysis strategies to increase the value of
27   genomics, metabolomics, transcriptomics, spectroscopic, phenotypic
28   (/in vitro/ and /in planta/), and fermentation/formulation process
29   data for discovery and development
30 + Lead the development of multiple systems while coaching, mentoring,
31   and developing developers and engineers
32 + Served as a key collaborator on multiple cross-function and
33   cross-divisional projects, including leading the architecture of a
34   life science collaboration using serverless architecture to provide
35   machine-learning estimates of critical parameters from
36   spectrographic measurements
37 + Established and developed network of internal and external contacts
38   for technical implementation of Bayer program goals.
39 ** Debian Developer \hfill 2004--Present
40 + Maintained, managed configurations, and resolved issues in multiple
41   packages written in R, perl, python, scheme, C++, and C.
42 + Resolved technical conflicts, developed technical standards, and
43   provided leadership as the elected chair of the Technical Committee.
44 + Developer of [[https://bugs.debian.org][Debbugs]], a perl and SQL-based issue-tracker with ≥ 100
45   million entries with web, REST, and SOAP interfaces.
46 + Provided vendor-level support for complex systems integration issues
47   on Debian GNU/Linux systems.
48 ** Research Scientist at UIUC \hfill 2015--2017
49 + Planning, design, organization, execution, and analysis of multiple
50   complex epidemiological studies involving epigenomics,
51   transcriptomics, and genomics of diseases of pregnancy and
52   post-traumatic stress disorder.
53 + Published results in scientific publications and presented results
54   orally at major scientific conferences.
55 + Wrote and completed grants, including budgeting, scientific
56   direction, project management, and reporting.
57 + Mentored graduate students and collaborated with internal and
58   external scientists.
59 + Performed literature review, training, and applied new techniques to
60   maintain abreast of current scientific literature, principles of
61   scientific research, and modern statistical methodology.
62 + Wrote software and designed relational databases using R, perl, C,
63   SQL, make, and very large computational systems ([[https://bluewaters.ncsa.illinois.edu/][Blue Waters]])
64 ** Postdoctoral Researcher at USC \hfill 2013--2015
65 + Design, execution, and analysis of an epidemiological study to
66   identify genomic variants associated with systemic lupus
67   erythematosus using targeted deep sequencing.
68 + Wrote multiple pieces of software to reproducibly analyze and
69   archive large datasets resulting from genomic sequencing.
70 + Coordinated with clinicians, molecular biologists, and biologists to
71   produce analyses and major reports.
72 ** Postdoctoral Researcher at UCR \hfill 2010--2012
73 + Executed and analyzed an epidemiological study to identify genomic
74   variants associated with systemic lupus erythematosus using prior
75   information and array based approaches in a trio and cross sectional
76   study of individuals from the Los Angeles and greater United States.
77 + Wrote and maintained multiple software components to reproducibly
78   perform the analyses.
79 * Education
80 ** Doctor of Philosophy (PhD) in Cell, Molecular and Developmental Biology \hfill UC Riverside
81 ** Batchelor of Science (BS) in Biology \hfill UC Riverside
82
83 * Skills
84 ** Leadership and Mentoring
85 + Lead teams of PhD and MD scientists in multiple scientific and
86   industrial programs
87 + Mentored graduate students and Outreachy and Google Summer of Code
88   interns
89 + Former chair of Debian's Technical Committee
90 + Head developer behind https://bugs.debian.org
91 ** Bioinformatics, Genomics, and Epigenomics
92 + NGS and array-based Genomics and Epigenomics of complex human
93   diseases using RNA-seq, targeted DNA sequencing, RRBS, Illumina
94   bead arrays, and Affymetrix microarrays from sample collection to
95   publication
96 + Reproducible, scalable bioinformatics analysis using make,
97   nextflow, and cwl based workflows on cloud- and cluster-based
98   systems on terabyte-scale datasets
99 + Alignment, annotation, and variant calling using existing and custom
100   software, including GATK, bwa, STAR, and kallisto
101 + Using evolutionary genomics to identify causal human variants
102 ** Statistics
103 + Statistical modeling (regression, inference, prediction, and machine
104   learning in very large (> 1TB) datasets) using R and python.
105 + Correcting & experimental design to overcome multiple testing,
106   confounders, and batch effects (both Bayesian and frequentist)
107 + Reproducible research
108 ** Software Development
109 + Languages: python, R, perl, C, C++, python, groovy, sh (bash, POSIX,
110   and zsh), make
111 + Collaborative Development: git, Jira, gitlab CI/CD, github actions,
112   Aha!, continuous integration & deployment, automated testing
113 + Web, Mobile: Shiny, jQuery, JavaScript
114 + Databases: Postgresql (PL/SQL), SQLite, Mysql, NoSQL
115 ** Big Data
116 + Parallel and Cloud Computing (slurm, torque, AWS, OpenStack, Azure)
117 + Inter-process communication: MPI, OpenMP
118 + Filestorage: Gluster, CEFS, GPFS, Lustre
119 + Linux system administration
120 ** Applications and Daemons
121 + Web: apache, ngix, varnish (load balancing/caching), REST, SOAP,
122   Tomcat
123 + Build Tools: GNU make, cmake
124 + Virtualization: libvirt, KVM, qemu, VMware, docker
125 + VCS: git, mercurial, subversion
126 + Mail: postfix, exim, sendmail, spamassassin
127 + Configuration Infrastructure: puppet, hiera, etckeeper, git
128 + Documentation: \LaTeX, confluence, emacs, MarkDown, MediaWiki, ikiwiki, trac
129 + Monitoring: munin, nagios, icinga, prometheus
130 + Issue Tracking: Debbugs, Request Tracker, Trac, JIRA
131 + Office Software: Gnumeric, Libreoffice, \LaTeX, Word, Excel,
132   Powerpoint
133 ** Networking
134 + Hardware, Linux routing and firewall experience, ferm, DHCP,
135   openvpn, bonding, NAT, DNHS, SNMP, IPv4, and IPv6.
136 ** Operating systems
137 + GNU/Linux (Debian, Ubuntu, Red Hat)
138 + Windows
139 + MacOS
140 ** Communication
141 + Strong written communication skills as evidenced by publication
142   record
143 + Strong verbal and presentation skills as evidenced by presentation,
144   leadership, and teaching record
145 * Authored Open Source Software
146 + *[[http://bugs.debian.org][Debbugs]]*: Bug tracking software for the Debian GNU/Linux
147    distribution. [[https://bugs.debian.org]]
148 + *[[http://git.donarmstrong.com/r/CairoHacks.git][CairoHacks]]*: Bookmarks and Raster images for large PDF plots in R.
149 + *[[http://rzlab.ucr.edu/function2gene/][Function2Gene]]*: Gene selection tool based on literature mining which
150    enables Bayesian approaches to significance testing.
151 + *[[http://rzlab.ucr.edu/scripts/wheel/wheel.cgi?sequence=ABCDEFGHIJLKMNOP&submit=Submit][Helical Wheel Projections]]*: Web-based tool to draw helical wheel
152    protein projections.
153 * Publications and Presentations
154 + 24 peer-reviewed publications cited over 3000 times:
155   https://dla2.us/pubs
156 + Publication record in GWAS, transcriptomics, SLE, GBM, epigenetics,
157   comparative evolution of mammals, and lipid membranes
158 + H index >= 20
159 + Multiple presentations on EWAS of PTSD, genetics of SLE, and Open
160   Source: https://dla2.us/pres
161
162 * Funding and Awards
163 ** Grants
164 + 2017 R Consortium: *[[https://www.r-consortium.org/blog/2017/04/03/q1-2017-isc-grants][Adding Linux Binary Builders to R-Hub]]* Role:
165   Co-PI
166 + 2015 Blue Waters Allocation Grant: *Making ancestral trees using Bayesian
167   inference to identify disease-causing genetic variants* Role:
168   Primary Investigator
169 + *Tracking placenta and uterine funciton using urinary extracellular vesicles* (R21
170   RFA-HD-16-037) Role: Key Personnel
171 + *NIAMS* R01-AR045650-04 *Genetics of Childhood Onset SLE* to Chaim O. Jacob.
172   Role: Key Personnel
173 ** Scholarships and Fellowships
174 + 2001--2003: University of California, Riverside Doctoral Fellowship
175 + 1997--2001: Regents of the University of California Scholarship.
176
177
178