Cargo: Ingeniero de continuidad operacional TROC Hosting
Descripción de cargo:
El Ingeniero de continuidad operacional TROC Hosting tendrá la responsabilidad de la administración y gobierno remoto de la Plataforma de Servidores de Aplicaciones Industriales, plataforma que corresponde al equipamiento físico tecnológico encargado del procesamiento de los softwares que ejecutan los procesos productivos del negocio del cliente.
Sus principales funciones corresponderán a:
- Proporcionar experiencia en la materia (Subject Matter Expert, SME) para resolver problemas prioritarios, implementar sistemas de trabajo complejos y seguros, utilizando procesos de gestión del trabajo existentes en entorno del cliente
- Cumplir con los estándares y procesos tecnológicos de la Plataforma de Servidores de Aplicaciones Industriales del cliente.
- Ejecutar análisis de la causa raíz para problemas complejos, de las actividades de mantenimiento de la plataforma de Servidores de Aplicaciones Industriales con el objetivo de reducir las tasas de falla (MTBF) y el tiempo de inactividad de los equipos del cliente,
- Ejecutar labores de implementación e incorporación a inventario de control de los equipos de procesamiento (Servidores físicos y máquinas virtuales que corren en dichos equipos) que conforman la Plataforma de Servidores de Aplicaciones Industriales del cliente,
- Ingresar en la herramienta de monitoreo y conexión de accesos remotos los servidores, sistemas de disco y de respaldo, y máquinas virtuales que conforman la Plataforma de Servidores de Aplicaciones Industriales de la red del cliente.
- Realizar monitoreo proactivo de la Plataforma de Servidores de Aplicaciones Industriales del cliente.
- Apoyar la gestión de la capacidad de la Plataforma de Servidores de Aplicaciones Industriales del cliente.
- Ejecutar las actividades de servicio correspondientes a la resolución de incidencias, ejecución de solicitudes de cambio, cumplimentación de solicitudes de servicio e investigación de registros de problemas.
- Liderar la investigación de incidentes para sucesos de alta prioridad, proporcionando información de revisión de cambio posterior a su implementación e información relevante en los casos que se levante un RCA (Root Cause Analysis; Análisis de Causa Raíz).
- Apoyar en el poblamiento y actualizacion de la CMDB (Configuration Management Database; Base de datos de configuraciones de los equipos).
- Custodiar la documentación y mantener actualizados los diagramas de la Plataforma de Servidores de Aplicaciones Industriales del cliente.
Want more jobs like this?
Get jobs in Santiago, Chile delivered to your inbox every week.
Las características de los candidatos son:
- Profesional del área de las tecnologías de información con grado académico de licenciado o superior como mínimo
- Experiencia de al menos 5 años en roles de administración y operación de grandes infraestructuras de TI
- Experiencia en el apoyo de incidentes ligados a las plataformas de servidores, virtualización y almacenamiento y respaldo
- Experiencia en el manejo de incidentes y en el cumplimiento de SLA/KPI para clientes
- Experiencia comprobable en la administración y explotación de plataformas con tecnologías de virtualización (VMware, VSphere, vCenter, vCloud, VMware View, vRealize, vSAN, NSX, Microsoft Hyper-V)
- Experiencia en la actualización de plataformas virtuales usando VMware vSphere upgrade, P2V V2V Migration y Server Migration junto con capacidades de scripting PowerShell
- Habilidades de resolución de problemas en ESXi usando línea de comando
- Experiencia en respaldo de máquinas virtuales usando productos como VEEAM y VMware Data Protection
- Experiencia en plataforma de servidores ( Cisco Unified Computing Systems, HP, Dell, IBM)
- Conocimientos demostrables en Linux OS (RedHat, CentOS, Debian, etc.)
- Administración, coordinación e implementación de actualizaciones de software y aplicación de parches y hotfixes en los servidores
- Creación y modificación de scripts para la ejecución de tareas repetitivas
- Experiencia en metodología de parchado masivo de máquinas
- Experiencia en administración de almacenamiento en entornos VMware y Linux
- Experiencia en la configuración y resolución de problemas en plataformas Windows Server 2012/2016/2019 y 2022
- Experiencia analizando eventos de Windows para identificar fallos de aplicaciones o del sistema operativo
- Experiencia en parchado de Windows usando SCCM y WSUS
- Experiencia en Active Directory en ambientes multi dominio y multi-forest (Manejo de políticas de AD)
- Experiencia en la configuración y resolución de errores de file systems de Windows
- Experiencia en la migración de sistemas operativos Windows de versiones antiguas a nuevas
- Experiencia en la configuración de servicios Windows (DHCP, DNS)
- Experiencia en securitización de plataformas Windows
- Conocimientos de administración y soporte de plataformas tales como EMC VMAX, VNX, Unity, XTREMIO, VPLEX, Pure
- Conocimientos de tecnologías de respaldo tales como Commvault, Avamar, Data Domain
- Conocimientos de administración y soporte de NETAPP FAS and E-series
- Conocimientos de tecnologías de almacenamiento (SAN, NAS, iSCSI, Fiber Channel, Enterprise Storage Arrays, Data Replication, HSM)
- Conocimientos de upgrade de firmware usando herramientas de administración tales como Dell iDRAC, HPE ILO, HPE OneView
- Conocimiento escrito y hablado de inglés (Deseable)
- Sólida comprensión de los componentes de la infraestructura de TI como servidores, redes, bases de datos y aplicaciones.
- Experiencia con plataformas de gestión de tickets tales como Service Now
- Excelentes habilidades de solución de problemas para diagnosticar y resolver problemas del ambiente operativo.
- Comunicación efectiva para colaborar con equipos multifuncionales e informar los hallazgos con claridad.
- Deseables certificaciones en las plataformas del cliente (VMware, Linux, Windows)
La modalidad de trabajo será en turnos