个人简历
个人信息
工作经历
2017.07~2020.04 永乐科技有限公司 系统运维工程师
负责亚马逊云、阿里云、华为云、腾讯云、百度云的配置管理和系统维护;
负责搭建Jenkins自动化持续集成运维平台,提高运维、开发协作效率,规范操作流程;
负责网站及APP的维护和管理,线上系统层面稳定性保障,系统监控、应用监控、日志监控等.
2020.04~2021.10 腾云悦智科技(深圳)有限责任公司 运维工程师
负责基于大客户售后QQ群,针对客户提出的问题进行及时专业的响应处理;
负责梳理提炼用户侧的日常问题及需求,优化处理效率,推动用户诉求的落地;
主动识别客户的紧急重要事件,按照规范进行有效的内部升级处理,避免客户损失被放大
通过IM/电话/远程/拜访会面等方式与客户紧密交流,持续提升客户满意度及产品体验;
持续学习,通过培训,知识库,平台工具,流程优化等手段与内部同事紧密协作并提升问题处理效率。
2021.11~至今 深圳市北鲲云计算有限责任公司 高级技术支持工程师
负责售后技术支持团队日常管理、7X24小时排班、绩效考核及私有化和PoC 项目实施跟进工作;
负责北鲲云超算平台用户手册编写、更新、维护,内部支持团队wiki建设;
负责阿里云、腾讯云、百度云、华为云、AWS、Oracle、Azure、Google 云厂商账号管理和维护建设;
负责北鲲云超算平台科学计算软件的安装、维护、更新、及技术后台用户模块,软件模块管理和维护;
负责云上用户、计算资源、存储管理及私有化Luster 并行文件系统集群搭建和私有化超算集群运维和更新部署;
负责基于微信群 对使用HPC 超算平台 ToB、ToC 业务的客户进行技术支持、产品培训并定期收集需求及建议。
个人技能
熟悉路由器及交换机等网络设备的基础配置、包括各大云厂商的专有网络VPC建设;
熟悉Linux系统的维护环境,堡垒机搭建和使用,配置安全组和防火墙及用户权限,优化系统安全机制;
熟悉Shell脚本,能够编写运维脚本监控服务器的相关信息,进行自动化运维;
熟悉高可用及负载均衡原理,以及Nginx的反向代理、负载均衡等相关技能;
熟悉Mysql数据库的增删改查、读写分离、MHA集群搭建及维护;
熟悉Tomcat、Nginx、Apache、 Node.js等开源软件,能够部署LNMP、LAMP集群及调优;
熟悉JenKins持续集成及版本控制工具GIT、SVN、GitLab的原理及搭建,构建CI/CD自动部署;
熟悉Ansible常用模块和Playbook进行自动化运维,批量程序部署、批量管理及配置;
熟悉KVM自定义虚拟设备及管理,Docker容器自定义镜像及仓库和Dockerfile部署与应用;
熟悉Zabbix监控原理及架构搭建和维护大型集群监控平台;
熟悉分布式开源调度平台XXL-JOB项目,构建周期计划任务调度可视化,钉钉及时报警功能;
熟悉阿里云、腾讯云、百度云、华为云、AWS、Oracle、Azure、Google 的使用和管理;
熟悉ELK日志分析平台,ES、Kibana、Logstach的部署及Filebeat的使用;
熟悉GlusterFS、Luster 分布式并行文件系统的管理和维护并搭建过以 InfiniBand 网络的大型并行文件系统集群;
熟悉Slurm 作业调度系统安装、更新、维护及使用,并搭建维护多个超一万核心的大型HPC 私有化集群项目;
熟悉Spack、Easybuild 自动化安装、构建软件框架,能够顺利安装不同版本的foss,Intel 编译工具链软件;
熟悉HPC Packer 自动化构建工具,自动化构建多个云厂商 HPC 集群镜像。
项目经历
项目一、
项目名称:使用 Jenkins+GitLab+Ansible 实现 CI/CD 持续集成以及自动发布代码
项目描述:
因公司的产品会不定期更新,为了节约项目集成的时间,透明化构建过程,井然有序的运行脚本,实现持续集成和自动化部署,开发部门的各程序员将写好的代码推送到Gitlab仓库,Jenkins服务器将Gitlab中代码拉去下来进行构建,通过Ansible自动运维工具在需要部署代码的服务器上运行已经提前写好的Python脚本,将Jenkins服务器上构建完成的代码部署到相应文件夹内,发版完成。
项目职责:
1.部署Jenkins,GitLab服务器并且用Ansible 模块配置相应服务使其能实现自动化持续集成功能。
2.测试运行效果达到预期后投入生产环境中
项目二、
项目名称:亚马逊云Auto Scaling+ELB+EC2+EFS高可用弹性伸缩项目
项目描述:
因公司的游戏项目推出上线,PV量不持续稳定,为更好的节约计算资源、优化项目成本,搭建亚马逊云Auto Scaling高可用架构配合云厂商负载均衡ELB组件,制作自定义启动模板、AMI再加上多线路CDN,有效的防护黑客攻击,降低游戏延迟,给玩家带来了极好的游戏体验。
项目职责:
负责AMI和启动模板的更新和维护及Auto Scaling组和EFS的构建。
负责XXL-JOB项目的周期计划任务调度平台的管理和维护。
负责多线路CDN、CloudFront及多域名多证书和阿里云OSS对象储存的定时更新及管理。
负责亚马逊、阿里云、腾讯云、华为云、百度云专有网络VPC的基础建设及云服务器的安全和审计管理。
项目三、
项目名称:腾讯云大客户售后一线运维
项目描述:
腾讯云,腾讯集团倾力打造的云计算品牌,业务范围覆盖金融、互联网、教育、政府机构等多个行业类型,基于各行业业务特性,为客户提供咨询服务和定制化云计算解决方案,满足政府、企业对信息化和数字化的要求,腾云悦智科技有限公司,是腾讯为加速发力B端市场而发起投资成立的公司,是腾讯CSIG事业群旗下子公司,专注为腾讯云旗下多个产品提供技术支撑服务。
项目职责:
负责基于售后QQ群、企业微信群录单的形式,解决客户在使用腾讯云产品的同时遇到的各种咨询及技术问题。
负责收集用户侧的报错信息及需求,通过平台工具进行初步排查及定位故障原因,给出解决方案及建议。
通过电话/远程/等方式与客户紧密交流,彻底了解客户需求及建议,进行整合,内部推进及解决。
项目四、
项目名称:北鲲云HPC 超算平台技术支持
项目描述:
深圳北鲲云计算有限公司 2018年4月诞生于欧洲硅谷—斯德哥尔摩Kista,专注于为高性能计算行业提供一站式Cloud-HPC产品和服务,于2019年3月进入中国大陆市场,自主研发的北鲲云超算平台,主要应用于生命科学、人工智能、芯片设计、高科技制造、CAE/CFD、大气海洋环境、天文地球物理、影视与动漫制作、高性能计算超级计算机等领域,已成功服务中国数千家企业、研究所及高校。
项目职责:
负责技术支持团队的绩效考核、7X24小时排班、任务分配,项目推进及进度汇报,维护客户关系及技术支撑。
负责多个私有化项目实施交付、线上SAAS平台运维,多个云厂商账号管理和运维
负责多个产品线售后工作,不定期出差拜访客户,配合铁三角,做好项目售前、售中、售后工作。
个人评价
有良好的团队协作精神,强烈的责任心和积极主动的工作态度,能够很快进入工作状态。
具有信息安全防范意识,对网络和系统安全的整体防范和应对措施有一定的实践经验。
思路清晰,学习能力强,有进取心,做事稳重,同时具备独立完成工作能力。
最后更新于