Cómo diagnosticar caídas del minero y bajo hashrate

Una guía práctica de diagnóstico para encontrar la causa de caídas del minero, bajo hashrate, shares rechazadas, problemas de calor, fallas de energía y desconexiones del pool.

3 min de lectura
minería

Las caídas del minero y el bajo hashrate salen caras porque pueden estar a la vista sin que se noten. Una máquina puede estar encendida, con los ventiladores girando, y aun así no producir el trabajo aceptado por el que estás pagando electricidad.

Un buen diagnóstico separa el minero en capas. Revisa energía, refrigeración, red, pool, firmware y hardware de a una cosa por vez. El bajo hashrate es un síntoma, no un diagnóstico, aunque el proceso de minería subyacente esté construido alrededor de un objetivo de prueba-de-trabajo muy específico.

Compara el hashrate local con el del pool

El hash rate local es lo que la máquina cree que está produciendo. El hashrate del pool se estima a partir de las shares aceptadas a lo largo del tiempo. Los números del pool fluctúan, sobre todo en ventanas cortas, así que evita tomar decisiones basadas en un promedio de cinco minutos. Una vista de una hora es mejor. Una vista de un día completo es mejor si el minero es lo bastante estable como para funcionar tanto tiempo.

Si el hashrate local y el hashrate del pool son bajos, mira primero el propio minero: calor, energía, placas ausentes, errores de ventilador, ajustes de firmware o tuning inestable. Si el hashrate local parece normal pero el crédito del pool es bajo, revisa shares rechazadas, shares stale, región del pool, configuración del worker y confiabilidad de la red.

Esta separación evita trabajo desperdiciado. Una placa ausente y un cable Ethernet defectuoso pueden reducir los ingresos, pero no son el mismo problema.

Revisa las shares antes de adivinar

Una share es una prueba de que tu minero envió trabajo útil a un mining pool. Las shares aceptadas se acreditan. Las shares rechazadas no.

Algunas shares rechazadas son normales. Una tasa de shares rechazadas constantemente alta es una señal de advertencia. Las shares stale suelen apuntar a latencia, pérdida de paquetes, distancia al pool, equipos de red sobrecargados o un problema temporal del pool. Las shares invalid suelen apuntar a tuning inestable, problemas de firmware, chips que están fallando o problemas de validación de shares del lado del pool como los descritos en las notas sobre pooled mining de Bitcoin Wiki.

Mira el tipo de rechazo, no solo el porcentaje. Si las shares stale aumentan después de mover el minero a un puente Wi-Fi, un adaptador powerline o un endpoint de pool lejano, sospecha de la ruta de red. Si las shares invalid aumentan después de cambiar la frecuencia, el voltaje o el modo de eficiencia, sospecha del perfil de tuning. Si varios mineros muestran el mismo problema al mismo tiempo, sospecha de la infraestructura compartida antes de culpar a una sola máquina.

Confirma la estabilidad del pool y la red

La mayoría de los mineros ASIC se comunican con los pools mediante el protocolo Stratum. La minería no necesita mucho ancho de banda, pero sí necesita una conexión estable. Las interrupciones pequeñas pueden reducir el trabajo acreditado incluso cuando la máquina parece estar bien, y el resumen de Stratum V2 de Braiins es un buen contexto para entender por qué importa la comunicación con el pool.

Usa Ethernet cableado siempre que sea posible. Reemplaza el cable por uno que sepas que funciona bien. Prueba otro puerto del switch. Confirma que el minero tenga una dirección IP estable. Comprueba que la URL del pool, el nombre del worker y la contraseña sean correctos. Si el pool ofrece endpoints regionales, elige el más cercano que sea confiable. Configura URLs de pools de respaldo para que el minero no quede inactivo cuando falle un endpoint.

Si un minero se desconecta mientras otros en la misma red siguen conectados, concéntrate en ese minero, cable, puerto o firmware. Si todos los mineros se desconectan juntos, concéntrate en el router, switch, módem, ISP, DNS o disponibilidad del pool.

Busca problemas de calor y flujo de aire

El calor es una de las causas más comunes de caídas y baja producción. Los mineros ASIC convierten casi toda la energía de entrada en calor. Si ese calor no se elimina, el minero puede hacer throttling, reiniciarse, enviar trabajo malo o apagarse.

No evalúes la refrigeración según si la habitación se siente cómoda. Evalúala por la temperatura de admisión, la extracción del aire de salida, las temperaturas de las placas, las velocidades de los ventiladores y la estabilidad bajo carga. Que el aire caliente de salida vuelva a entrar por la admisión puede volver inestable a un minero incluso en una habitación grande.

Revisa el sistema de refrigeración en términos físicos simples. ¿Los filtros están obstruidos? ¿Los ventiladores funcionan? ¿El polvo bloquea los disipadores? ¿El aire de salida se está alejando del lado de admisión? ¿El problema empeora por la tarde o cuando la habitación está cerrada?

Para instalaciones domésticas, la guía sobre calor, ruido y refrigeración para mineros en casa cubre el lado práctico de sacar el aire caliente de una habitación.

Inspecciona placas, ventiladores y logs

La mayoría de los dashboards de ASIC muestran cada hash board por separado. Revisa si todas las placas se detectan, si los conteos de chips parecen normales y si una placa informa un hashrate mucho menor, una temperatura más alta o más errores de hardware que las demás.

La control board también puede crear síntomas confusos porque coordina la configuración de red, los ventiladores, las hash boards, las conexiones al pool y el comportamiento del firmware. Un problema del lado de control puede hacer que placas que por lo demás están sanas parezcan inestables.

Lee los logs antes de tocar el hardware. Busca errores de detección de placas, errores de ventilador, advertencias de voltaje, apagados por temperatura, fallas de autorización del pool y bucles de arranque repetidos. Las máquinas usadas merecen pruebas más largas porque algunas fallas aparecen solo después de varias horas a máxima temperatura.

Trata la energía como una sospecha real

La energía inestable puede causar reinicios, placas ausentes, errores de ventilador, bajo hashrate o caídas que parecen aleatorias. La fuente de alimentación tiene que entregar carga sostenida, no solo sobrevivir al arranque.

Revisa conectores, encastre de cables, voltaje, comportamiento del interruptor automático y cualquier señal de daño por calor. Enchufes flojos, cables subdimensionados, circuitos débiles, cargas compartidas, conectores dañados y PSUs sobrecalentadas pueden reducir la estabilidad.

No sigas reiniciando un minero que huele a caliente, dispara interruptores, muestra marcas de quemadura o tiene enchufes dañados. Detente y arregla primero el problema eléctrico. El equipo de minería es un aparato de alta carga continua, así que trata la ruta de energía como parte del sistema de minería.

Si el minero funciona con un perfil de baja potencia pero falla con un perfil de alto rendimiento, eso es evidencia útil. Puede significar que la refrigeración, la entrega de energía o el estado de las placas no pueden sostener la configuración más alta.

Revierte cambios recientes

Cuando un problema empieza después de un cambio, respeta la línea de tiempo. El software de minería y el firmware controlan URLs de pools, nombres de worker, comportamiento de ventiladores, frecuencia, voltaje, límites de potencia y comportamiento de reinicio. Un solo ajuste incorrecto puede provocar horas de inactividad.

Vuelve a la última configuración que sabes que funcionaba bien. Cambia una variable a la vez. No cambies de pool, actualices firmware, cambies hardware de red y apliques un overclock en la misma sesión de diagnóstico. Si el rendimiento mejora, necesitas saber qué cambio fue el que importó.

Vale la pena revisar los conceptos básicos de software de minería y firmware si el dashboard del minero muestra errores que no reconoces.

Usa un orden simple de diagnóstico

Usa el mismo orden cada vez:

  1. Revisa el estado físico, ventiladores, polvo, enchufes y daños evidentes.
  2. Confirma la refrigeración: temperatura de admisión, ruta de salida del aire, temperaturas de placas y velocidad de ventiladores.
  3. Confirma la red: cable Ethernet, puerto del switch, dirección IP, URL del pool y pools de respaldo.
  4. Compara el hashrate local con las shares aceptadas del pool durante una ventana significativa.
  5. Lee los logs en busca de errores de placas, ventiladores, voltaje, temperatura, pool y firmware.
  6. Revierte cambios recientes de firmware, pool o tuning.
  7. Considera reemplazar piezas solo después de que la evidencia apunte al hardware.

Este orden mantiene el diagnóstico en terreno práctico. Un minero puede estar caído porque falló una placa, pero también puede estar caído porque un cable está mal, el calor está recirculando, el nombre del worker es incorrecto o el endpoint del pool está demasiado lejos.

Registra lo normal antes de que falle

El mejor momento para recopilar datos de referencia es cuando el minero está sano. Anota el hashrate normal, el promedio del pool, la tasa de shares rechazadas, la velocidad de ventiladores, el rango de temperatura de las placas, la temperatura de admisión, la versión de firmware, la URL del pool, el nombre del worker y el perfil de potencia.

Esas notas convierten síntomas vagos en patrones. Si los reinicios ocurren en el momento más caluroso del día, la refrigeración es sospechosa. Si las shares rechazadas aumentan después de una actualización de firmware, la configuración es sospechosa. Si una placa se va quedando lentamente por debajo de las demás, el hardware es sospechoso.

La minería recompensa el trabajo aceptado y constante. Un minero que funciona limpiamente durante semanas suele ser más valioso que uno que muestra un número alto durante diez minutos y luego se cae. Diagnostica por capas, cambia una cosa a la vez y deja que la evidencia señale la causa antes de gastar dinero en piezas.