En el episodio anterior de “Mi nuevo peligro de incendio”, fuimos de compras, pusimos las compras dentro de una caja de madera, agregamos unos discos duros, conectamos y encendimos todo y no anduvo.
Al parecer otras personas en internet tuvieron exactamente el mismo síntoma con exactamente la misma placa: al conectar mas de un disco por canal, todo se cae a pedazos:
- LSI 9207-8E will only see a single drive per controller port
u/matjam, r/DataHoarder, Reddit - LSI SAS 9207-8e HBA only works with one drive
Logikgear, ixSystems Community Forums
En ambos casos la solución fue la misma: quejarse con el vendedor, que reconoció la falla y les mando una placa de remplazo. El tema es que… remplazar la placa es prácticamente inviable en mi caso porque:
- Tendría que mandar la placa a otro país
- La placa fue comprada hace meses, solo que recién ahora pude probarla con mas de un disco por puerto.
- Incluso si lograse que el vendedor me mande una de remplazo, probablemente Aduanas quiera cobrarme el remplazo y la verdad no tengo ganas de averiguar ni de discutir.
Por lo tanto mis opciones son:
- Hacerla andar.
- Comprar otra.
Dado que tratar de hacerla andar es gratis, opté primero por esa vía.
Flash-me up
Lo primero que se me ocurrió fue tratar de flashear la misma versión de firmware que tiene la controladora que esta funcionando sin problemas (LSI SAS9211-8i, lo mismo pero con puertos internos en lugar de externos). Esto es porque al bootear el PC que oficia de homeserver, solo veo esa controladora en la BIOS de LSI, cuando debería de ver ambas.
Dado a que soy propenso a mandarme cagadas, me niego a realizar cualquier operación de flasheo en la misma maquina que tiene la controladora que funciona, lo ultimo que preciso son 2 placas rotas. Así que revolví entre las sobras de hardware y rearme el viejo server:
Luego de armar la maquina con sobras, instalar Windows (por lo general siempre hacen el utilitario de flasheo para Windows, no tanto para otros sistemas) y bajarme el instalador junto a los firmwares de la pagina de Broadcom (si, LSI fue vendida demasiadas veces) me puse a flashear la controladora… sin mucha suerte.
Lo único que conseguí fue cargar la ROM, y ahora si muestra el utilitario de configuración en el arranque de la maquina, pero por algún motivo este se cuelga al conectarle una cantidad cualquiera de discos. Hmmm….
Resulta que tras probar y probar se me ocurrió intentar borrar toda la flash, pero por algún motivo que desconozco me decía que esa operación “no estaba soportada en esta plataforma”.
Ok, no te gusta Windows? Probemos Linux.
Trate de correr los utilitarios de LSI en un Live CD de Ubuntu, pero tampoco pude borrar la flash, esta vez con un error distinto (el cual no recuerdo y del cual no tome nota porque estaba ansioso).
La tercera es la vencida la tercera y punto
Doblemente derrotado, empece a buscar en internet a ver si alguien tenia alguna magia para poder borrar la flash entera y poder flashear esto como corresponde. Y, el que busca encuentra dicen… (a veces).
Encontré este post en el blog Techmattr: “Updated: SAS HBA crossflashing or flashing to IT mode, Dell Perc H200 and H310”
Resulta que ese post tiene todo lo que precisaba saber. De hecho, tiene mas de lo que precisaba para solucionar el problema, ya que el habla de flashear ciertas controladoras Dell Perc para que se comporten como LSI.
Siguiendo las instrucciones de ese post, al principio tampoco pude borrar la flash hasta que encontré una sección sobre maquinas UEFI. Resulta que se puede utilizar el sas2flash desde un shell EFI (es necesario tener el ejecutable sas2flash.efi), desde el cual finalmente pude vaciar la flash entera y flashear el firmware correctamente.
Como bonus, no me moleste en cargar la BIOS en esta controladora así me ahorro los 10-15 segundos extra que le agrega al proceso de boot, dado que nunca pienso bootear desde discos que se encuentren en la caja externa.
Importante: Si alguien por casualidad se encuentra con este problema y decide borrar la flash entera, que tome nota de la SAS Address ya que tras borrar la flash hay que restablecerla manualmente usando sas2flash.
Otra vez
Terminada toda esta porquería, pruebo por ultima vez para ver si tengo que sentarme a esperar un mes a que llegue un remplazo de USA o si puedo empezar a romper usar mis discos. Dejo que Windows (si Windows, es provisorio) arranque, conecto todo, prendo la fuente de la caja… y…
Como debería de haber sido desde un principio, aparecieron los ocho discos de 2TB. Como no se bien que hacer ahora para probar que funcionen, puse a Windows a hacer maldades, también conocido como un “spanned volume” que es una maldad en si.
Hipótesis
No estoy 100% seguro, pero mi sospecha esta en que había algún problema en la NVDATA/NVFLASH (o como sea que se llame). No tengo mucha evidencia al respecto, ni estoy familiarizado lo suficiente con estos dispositivos, pero dado a que el error aparecía al agregar múltiples discos, y que me fallaba al intentar acceder a la configuración una vez cargada la BIOS en la controladora, me hace sospechar que NVDATA contenía información incompatible con las versiones de firmware que tenia la placa de fabrica y en sus posteriores flasheos. Sumado a esto, leyendo en internet, la mayoría de estas placas son usadas o refurbished, muchas de ellas estuvieron anteriormente en maquinas e incluso eran rebrandings de otros OEM como por ejemplo HP e IBM. Posiblemente el vendedor flashea todas estas controladoras para que se comporten como una LSI y prueba con un disco por canal, asumiendo que si eso funciona, entonces la placa entera funciona. Pero bueno, es tan solo una hipótesis y no muy relevante ahora que se como vaciar correctamente la flash en caso de volver a tener este problema con una nueva controladora en un futuro.
Conclusión?
En los próximos días sabre si la controladora funciona como corresponde, ademas de si los discos están aceptable-mente sanos. Caso contrario, supongo que habrá una parte III, pero espero que no porque ya hice demasiado post para lo que va del año.
Capaz que para compensar, no posteo nada hasta el 2030.
Pingback:Mi nuevo peligro de incendio, parte I | Something Bense