个人简历

个人信息

工作经历

2017.07~2020.04 永乐科技有限公司 系统运维工程师

  • 负责亚马逊云、阿里云、华为云、腾讯云、百度云的配置管理和系统维护;

  • 负责搭建Jenkins自动化持续集成运维平台,提高运维、开发协作效率,规范操作流程;

  • 负责网站及APP的维护和管理,线上系统层面稳定性保障,系统监控、应用监控、日志监控等.

2020.04~2021.10 腾云悦智科技(深圳)有限责任公司 运维工程师

  • 负责基于大客户售后QQ群,针对客户提出的问题进行及时专业的响应处理;

  • 负责梳理提炼用户侧的日常问题及需求,优化处理效率,推动用户诉求的落地;

  • 主动识别客户的紧急重要事件,按照规范进行有效的内部升级处理,避免客户损失被放大

  • 通过IM/电话/远程/拜访会面等方式与客户紧密交流,持续提升客户满意度及产品体验;

  • 持续学习,通过培训,知识库,平台工具,流程优化等手段与内部同事紧密协作并提升问题处理效率。

2021.11~至今 深圳市北鲲云计算有限责任公司 高级技术支持工程师

  • 负责售后技术支持团队日常管理、7X24小时排班、绩效考核及私有化和PoC 项目实施跟进工作;

  • 负责北鲲云超算平台用户手册编写、更新、维护,内部支持团队wiki建设;

  • 负责阿里云、腾讯云、百度云、华为云、AWS、Oracle、Azure、Google 云厂商账号管理和维护建设;

  • 负责北鲲云超算平台科学计算软件的安装、维护、更新、及技术后台用户模块,软件模块管理和维护;

  • 负责云上用户、计算资源、存储管理及私有化Luster 并行文件系统集群搭建和私有化超算集群运维和更新部署;

  • 负责基于微信群 对使用HPC 超算平台 ToB、ToC 业务的客户进行技术支持、产品培训并定期收集需求及建议。

个人技能

  • 熟悉路由器及交换机等网络设备的基础配置、包括各大云厂商的专有网络VPC建设;

  • 熟悉Linux系统的维护环境,堡垒机搭建和使用,配置安全组和防火墙及用户权限,优化系统安全机制;

  • 熟悉Shell脚本,能够编写运维脚本监控服务器的相关信息,进行自动化运维;

  • 熟悉高可用及负载均衡原理,以及Nginx的反向代理、负载均衡等相关技能;

  • 熟悉Mysql数据库的增删改查、读写分离、MHA集群搭建及维护;

  • 熟悉Tomcat、Nginx、Apache、 Node.js等开源软件,能够部署LNMP、LAMP集群及调优;

  • 熟悉JenKins持续集成及版本控制工具GIT、SVN、GitLab的原理及搭建,构建CI/CD自动部署;

  • 熟悉Ansible常用模块和Playbook进行自动化运维,批量程序部署、批量管理及配置;

  • 熟悉KVM自定义虚拟设备及管理,Docker容器自定义镜像及仓库和Dockerfile部署与应用;

  • 熟悉Zabbix监控原理及架构搭建和维护大型集群监控平台;

  • 熟悉分布式开源调度平台XXL-JOB项目,构建周期计划任务调度可视化,钉钉及时报警功能;

  • 熟悉阿里云、腾讯云、百度云、华为云、AWS、Oracle、Azure、Google 的使用和管理;

  • 熟悉ELK日志分析平台,ES、Kibana、Logstach的部署及Filebeat的使用;

  • 熟悉GlusterFS、Luster 分布式并行文件系统的管理和维护并搭建过以 InfiniBand 网络的大型并行文件系统集群;

  • 熟悉Slurm 作业调度系统安装、更新、维护及使用,并搭建维护多个超一万核心的大型HPC 私有化集群项目;

  • 熟悉Spack、Easybuild 自动化安装、构建软件框架,能够顺利安装不同版本的foss,Intel 编译工具链软件;

  • 熟悉HPC Packer 自动化构建工具,自动化构建多个云厂商 HPC 集群镜像。

项目经历

项目一、

项目名称:使用 Jenkins+GitLab+Ansible 实现 CI/CD 持续集成以及自动发布代码

项目描述:

因公司的产品会不定期更新,为了节约项目集成的时间,透明化构建过程,井然有序的运行脚本,实现持续集成和自动化部署,开发部门的各程序员将写好的代码推送到Gitlab仓库,Jenkins服务器将Gitlab中代码拉去下来进行构建,通过Ansible自动运维工具在需要部署代码的服务器上运行已经提前写好的Python脚本,将Jenkins服务器上构建完成的代码部署到相应文件夹内,发版完成。

项目职责:

1.部署Jenkins,GitLab服务器并且用Ansible 模块配置相应服务使其能实现自动化持续集成功能。

2.测试运行效果达到预期后投入生产环境中

项目二、

项目名称:亚马逊云Auto Scaling+ELB+EC2+EFS高可用弹性伸缩项目

项目描述:

因公司的游戏项目推出上线,PV量不持续稳定,为更好的节约计算资源、优化项目成本,搭建亚马逊云Auto Scaling高可用架构配合云厂商负载均衡ELB组件,制作自定义启动模板、AMI再加上多线路CDN,有效的防护黑客攻击,降低游戏延迟,给玩家带来了极好的游戏体验。

项目职责:

  1. 负责AMI和启动模板的更新和维护及Auto Scaling组和EFS的构建。

  2. 负责XXL-JOB项目的周期计划任务调度平台的管理和维护。

  3. 负责多线路CDN、CloudFront及多域名多证书和阿里云OSS对象储存的定时更新及管理。

  4. 负责亚马逊、阿里云、腾讯云、华为云、百度云专有网络VPC的基础建设及云服务器的安全和审计管理。

项目三、

项目名称:腾讯云大客户售后一线运维

项目描述:

腾讯云,腾讯集团倾力打造的云计算品牌,业务范围覆盖金融、互联网、教育、政府机构等多个行业类型,基于各行业业务特性,为客户提供咨询服务和定制化云计算解决方案,满足政府、企业对信息化和数字化的要求,腾云悦智科技有限公司,是腾讯为加速发力B端市场而发起投资成立的公司,是腾讯CSIG事业群旗下子公司,专注为腾讯云旗下多个产品提供技术支撑服务。

项目职责:

  1. 负责基于售后QQ群、企业微信群录单的形式,解决客户在使用腾讯云产品的同时遇到的各种咨询及技术问题。

  2. 负责收集用户侧的报错信息及需求,通过平台工具进行初步排查及定位故障原因,给出解决方案及建议。

  3. 通过电话/远程/等方式与客户紧密交流,彻底了解客户需求及建议,进行整合,内部推进及解决。

项目四、

项目名称:北鲲云HPC 超算平台技术支持

项目描述:

深圳北鲲云计算有限公司 2018年4月诞生于欧洲硅谷—斯德哥尔摩Kista,专注于为高性能计算行业提供一站式Cloud-HPC产品和服务,于2019年3月进入中国大陆市场,自主研发的北鲲云超算平台,主要应用于生命科学、人工智能、芯片设计、高科技制造、CAE/CFD、大气海洋环境、天文地球物理、影视与动漫制作、高性能计算超级计算机等领域,已成功服务中国数千家企业、研究所及高校。

项目职责:

  1. 负责技术支持团队的绩效考核、7X24小时排班、任务分配,项目推进及进度汇报,维护客户关系及技术支撑。

  2. 负责多个私有化项目实施交付、线上SAAS平台运维,多个云厂商账号管理和运维

  3. 负责多个产品线售后工作,不定期出差拜访客户,配合铁三角,做好项目售前、售中、售后工作。

个人评价

  1. 有良好的团队协作精神,强烈的责任心和积极主动的工作态度,能够很快进入工作状态。

  2. 具有信息安全防范意识,对网络和系统安全的整体防范和应对措施有一定的实践经验。

  3. 思路清晰,学习能力强,有进取心,做事稳重,同时具备独立完成工作能力。

最后更新于