]> git.donarmstrong.com Git - don.git/blob - resume.mdwn
update dla cv
[don.git] / resume.mdwn
1 [[!meta title="Resumé"]]
2
3 # Experience
4 ## Team Lead Data Engineering at Ginkgo Bioworks 2022–Present
5 + Lead and manged team of data engineers, system administrators,
6   statisticians, bioinformaticians, and scientists at the PhD level
7   working within the AgBio unit of Ginkgo Bioworks.
8 + Mentored and coached team members in data science, bioinformatics,
9   data engineering, and statistics.
10 + Key leadership role in successful merger of AgBio unit with Ginkgo,
11   including all relevant R&D business applications and data-adjacent
12   systems.
13
14 ## Team Lead Data Engineering at Bayer Crop Science 2018–2022
15 + Hired, managed, and developed team of 5+ Data Engineers, Systems
16   Administrators, and Business Analysts working within the Biologics
17   R&D unit of Bayer Crop Science enabling data capture, data
18   integration, and operationalization of data analysis pipelines
19 + Developed and supervised implementation of data capture,
20   integration, and analysis strategies to increase the value of
21   genomics, metabolomics, transcriptomics, spectroscopic, phenotypic
22   (/in vitro/ and /in planta/), and fermentation/formulation process
23   data for discovery and development
24 + Lead the development of multiple systems while coaching, mentoring,
25   and developing developers and engineers
26 + Served as a key collaborator on multiple cross-function and
27   cross-divisional projects, including leading the architecture of a
28   life science collaboration using serverless architecture to provide
29   machine-learning estimates of critical parameters from
30   spectrographic measurements
31 + Established and developed network of internal and external contacts
32   for technical implementation of Bayer program goals.
33
34 ## Debian Developer 2004–Present
35 + Maintained, managed configurations, and resolved issues in multiple
36   packages written in R, perl, python, scheme, C++, and C.
37 + Resolved technical conflicts, developed technical standards, and
38   provided leadership as the elected chair of the Technical Committee.
39 + Developer of [Debbugs](https://bugs.debian.org), a perl and SQL-based issue-tracker with ≥ 100
40   million entries with web, REST, and SOAP interfaces.
41 + Provided vendor-level support for complex systems integration issues
42   on Debian GNU/Linux systems.
43
44 ## Research Scientist at UIUC 2015–2017
45 + Planning, design, organization, execution, and analysis of multiple
46   complex epidemiological studies involving epigenomics,
47   transcriptomics, and genomics of diseases of pregnancy and
48   post-traumatic stress disorder.
49 + Published results in scientific publications and presented results
50   orally at major scientific conferences.
51 + Wrote and completed grants, including budgeting, scientific
52   direction, project management, and reporting.
53 + Mentored graduate students and collaborated with internal and
54   external scientists.
55 + Performed literature review, training, and applied new techniques to
56   maintain abreast of current scientific literature, principles of
57   scientific research, and modern statistical methodology.
58 + Wrote software and designed relational databases using R, perl, C,
59   SQL, make, and very large computational systems ([Blue Waters](https://bluewaters.ncsa.illinois.edu/))
60
61 ## Postdoctoral Researcher at USC 2013–2015
62 + Design, execution, and analysis of an epidemiological study to
63   identify genomic variants associated with systemic lupus
64   erythematosus using targeted deep sequencing.
65 + Wrote multiple pieces of software to reproducibly analyze and
66   archive large datasets resulting from genomic sequencing.
67 + Coordinated with clinicians, molecular biologists, and biologists to
68   produce analyses and major reports.
69
70 ## Postdoctoral Researcher at UCR 2010–2012
71 + Executed and analyzed an epidemiological study to identify genomic
72   variants associated with systemic lupus erythematosus using prior
73   information and array based approaches in a trio and cross sectional
74   study of individuals from the Los Angeles and greater United States.
75 + Wrote and maintained multiple software components to reproducibly
76   perform the analyses.
77
78 # Education
79 + Doctor of Philosophy (PhD) in Cell, Molecular and Developmental Biology at UC Riverside
80 + Batchelor of Science (BS) in Biology at UC Riverside
81
82 # Skills
83 ## Leadership and Mentoring
84 + Lead teams of PhD and MD scientists in multiple scientific and
85   industrial programs
86 + Mentored graduate students and Outreachy and Google Summer of Code
87   interns
88 + Former chair of Debian's Technical Committee
89 + Head developer behind https://bugs.debian.org
90
91 ## Bioinformatics, Genomics, and Epigenomics
92 + NGS and array-based Genomics and Epigenomics of complex human
93   diseases using RNA-seq, targeted DNA sequencing, RRBS, Illumina
94   bead arrays, and Affymetrix microarrays from sample collection to
95   publication
96 + Reproducible, scalable bioinformatics analysis using make,
97   nextflow, and cwl based workflows on cloud- and cluster-based
98   systems on terabyte-scale datasets
99 + Alignment, annotation, and variant calling using existing and custom
100   software, including GATK, bwa, STAR, and kallisto
101 + Using evolutionary genomics to identify causal human variants
102
103 ## Statistics
104 + Statistical modeling (regression, inference, prediction, and machine
105   learning in very large (> 1TB) datasets) using R and python.
106 + Correcting & experimental design to overcome multiple testing,
107   confounders, and batch effects (both Bayesian and frequentist)
108 + Reproducible research
109
110 ## Software Development
111 + Languages: python, R, perl, C, C++, python, groovy, sh (bash, POSIX,
112   and zsh), make
113 + Collaborative Development: git, Jira, gitlab CI/CD, github actions,
114   Aha!, continuous integration & deployment, automated testing
115 + Web, Mobile: Shiny, jQuery, JavaScript
116 + Databases: Postgresql (PL/SQL), SQLite, Mysql, NoSQL
117
118 ## Big Data
119 + Parallel and Cloud Computing (slurm, torque, AWS, OpenStack, Azure)
120 + Inter-process communication: MPI, OpenMP
121 + Filestorage: Gluster, CEFS, GPFS, Lustre
122 + Linux system administration
123
124 ## Applications and Daemons
125 + Web: apache, ngix, varnish (load balancing/caching), REST, SOAP,
126   Tomcat
127 + Build Tools: GNU make, cmake
128 + Virtualization: libvirt, KVM, qemu, VMware, docker
129 + VCS: git, mercurial, subversion
130 + Mail: postfix, exim, sendmail, spamassassin
131 + Configuration Infrastructure: puppet, hiera, etckeeper, git
132 + Documentation: \LaTeX, confluence, emacs, MarkDown, MediaWiki, ikiwiki, trac
133 + Monitoring: munin, nagios, icinga, prometheus
134 + Issue Tracking: Debbugs, Request Tracker, Trac, JIRA
135 + Office Software: Gnumeric, Libreoffice, \LaTeX, Word, Excel,
136   Powerpoint
137
138 ## Networking
139 + Hardware, Linux routing and firewall experience, ferm, DHCP,
140   openvpn, bonding, NAT, DNHS, SNMP, IPv4, and IPv6.
141
142 ## Operating systems
143 + GNU/Linux (Debian, Ubuntu, Red Hat)
144 + Windows
145 + MacOS
146
147 ## Communication
148 + Strong written communication skills as evidenced by publication
149   record
150 + Strong verbal and presentation skills as evidenced by presentation,
151   leadership, and teaching record
152
153 # Authored Open Source Software
154 + *[Debbugs](http://bugs.debian.org)*: Bug tracking software for the Debian GNU/Linux
155    distribution. 
156 + *[CairoHacks](http://git.donarmstrong.com/r/CairoHacks.git)*: Bookmarks and Raster images for large PDF plots in R.
157 * Publications and Presentations
158 + 24 peer-reviewed publications cited over 3000 times:
159   https://dla2.us/pubs
160 + Publication record in GWAS, transcriptomics, SLE, GBM, epigenetics,
161   comparative evolution of mammals, and lipid membranes
162 + H index >= 20
163 + Multiple presentations on EWAS of PTSD, genetics of SLE, and Open
164   Source: https://dla2.us/pres
165
166 # Funding and Awards
167 ## Grants
168 + 2017 R Consortium: *[Adding Linux Binary Builders to R-Hub](https://www.r-consortium.org/blog/2017/04/03/q1-2017-isc-grants)* Role:
169   Co-PI
170 + 2015 Blue Waters Allocation Grant: *Making ancestral trees using Bayesian
171   inference to identify disease-causing genetic variants* Role:
172   Primary Investigator
173 + *Tracking placenta and uterine funciton using urinary extracellular vesicles* (R21
174   RFA-HD-16-037) Role: Key Personnel
175 + *NIAMS* R01-AR045650-04 *Genetics of Childhood Onset SLE* to Chaim O. Jacob.
176   Role: Key Personnel
177
178 ## Scholarships and Fellowships
179 + 2001–2003: University of California, Riverside Doctoral Fellowship
180 + 1997–2001: Regents of the University of California Scholarship.
181
182 # Academic Information
183
184 You can also read my [Curriculum Vitæ](curriculum_vitae)
185 ([pdf](dla-cv.pdf)), [Research Statement](research_statement)
186 ([pdf](research_statement.pdf)),
187 and [Teaching Statement](teaching_statement)
188 ([pdf](teaching_statement.pdf)).
189
190 For my contact information or additional references, please e-mail
191 <don@donarmstrong.com>
192