Base de datos de fatiga de aleaciones fabricadas de forma aditiva
Scientific Data volumen 10, Número de artículo: 249 (2023) Citar este artículo
784 Accesos
1 Altmetric
Detalles de métricas
La fatiga es un proceso de degradación mecánica que generalmente se evalúa en base a reglas empíricas y datos experimentales obtenidos de pruebas estandarizadas. Los datos de fatiga de los materiales de ingeniería se informan comúnmente en SN (relación tensión-vida), ε-N (relación deformación-vida) y da/dN-ΔK (relación entre la tasa de crecimiento de grietas por fatiga y el rango del factor de intensidad de la tensión). ) datos. Las propiedades mecánicas estáticas y de fatiga de las aleaciones de fabricación aditiva (AM), así como los tipos de materiales, los parámetros de AM, el procesamiento y las pruebas se recopilan de miles de artículos científicos hasta finales de 2022 utilizando procesamiento de lenguaje natural, aprendizaje automático y Técnicas de visión por computadora. Los resultados muestran que el rendimiento de las aleaciones AM podría alcanzar el de las aleaciones convencionales, aunque la dispersión de datos y la desviación del sistema están presentes. La base de datos (FatigueData-AM2022) está formateada en estructuras compactas, alojada en un repositorio abierto y analizada para mostrar sus patrones y estadísticas. La calidad de los datos recopilados de la literatura se mide mediante la definición de puntajes de calificación para los conjuntos de datos informados en estudios individuales y mediante las tasas de llenado de las entradas de datos en todos los conjuntos de datos. La base de datos también sirve como un conjunto de capacitación de alta calidad para el procesamiento de datos utilizando modelos de aprendizaje automático. Se describen los procedimientos de extracción y análisis de datos y las herramientas se publican. Se sugiere un lenguaje unificado de datos de fatiga para regular el informe de datos sobre el rendimiento de fatiga de los materiales para facilitar el intercambio de datos y el desarrollo de la ciencia abierta.
La fatiga es un proceso perjudicial de degradación mecánica que experimentan los materiales y componentes estructurales en servicio a largo plazo, por ejemplo, en la industria aeroespacial, de energía nuclear, del petróleo y del gas1. El diseño de integridad estructural teniendo en cuenta el daño por fatiga se puede realizar en principios de vida segura o tolerancia al daño. En el diseño de vida segura, las fallas no se consideran explícitamente y los productos deben retirarse del servicio después de la vida útil del diseño. La filosofía de diseño se basa en datos experimentales de especímenes estándar probados bajo condiciones de carga específicas, que pueden extenderse a componentes estructurales. En la práctica, los espectros de carga arbitrarios se manejan considerando el daño acumulativo, por ejemplo, usando la regla lineal de Miner2. También se pueden incluir los efectos del tamaño de las muestras, la tensión media, la multiaxialidad y el entorno. Los datos de vida útil (SN) producidos por pruebas controladas por esfuerzo (controlado por fuerza) y los datos de vida útil por deformación (ε-N) por pruebas controladas por deformación son los dos conjuntos fundamentales de datos experimentales para el diseño de vida segura, que describen la relación entre el máximo (σmax, εmax) o la amplitud (σa, εa) de la tensión/deformación y el número de ciclos de carga (N) y se utilizan comúnmente para fatiga de ciclo alto (HCF)/fatiga de ciclo bajo (LCF) diseño, respectivamente (Fig. 1a). En el diseño de tolerancia al daño, se considera que un componente estructural es capaz de soportar fallas (p. ej., grietas) de manera segura antes del siguiente punto de inspección, y luego el componente se repara o reemplaza2. El crecimiento de grietas por fatiga (FCG) puede racionalizarse en la teoría de la mecánica de la fractura y evaluarse experimentalmente utilizando especímenes de tensión compacta (CT). La dependencia de la tasa de FCG (da / dN) en el rango (ΔK) del factor de intensidad de estrés (SIF) se denomina, por lo tanto, en el monitoreo y mantenimiento de la salud estructural (Fig. 1a). Los datos de SN, ε-N y da/dN-ΔK ofrecen medidas estándar para la degradación de la resistencia mecánica bajo cargas cíclicas, que es una característica única que puede explotarse en la investigación centrada en datos.
Diseño de integridad estructural de componentes estructurales de fabricación aditiva (AM) utilizando datos de fatiga de pruebas estandarizadas. (a) Condiciones de carga representativas, tipos de especímenes y datos obtenidos de las pruebas de fatiga. ( b ) Procedimientos y parámetros de AM ilustrados a través de la técnica de fusión de lecho de polvo láser (L-PBF).
En comparación con el módulo de Young y la resistencia a la tracción, el rendimiento de fatiga de los materiales depende de sus microestructuras, las condiciones de la superficie y las condiciones ambientales y de carga2,3. El proceso de fatiga implica la evolución microestructural desde escalas nanométricas y microestructurales hasta escalas estructurales, y la predicción teórica del rendimiento sigue siendo un desafío4. Las bases de datos de fatiga adquieren así una importancia crucial para el diseño estructural. El inicio del Programa de integridad estructural de aeronaves (ASIP) en la década de 1950 condujo a un gran éxito en la prevención de fallas catastróficas y la prolongación de la vida útil de los componentes estructurales. Sin embargo, solo unas pocas bases de datos se publican, generalmente por instituciones de investigación autorizadas para aleaciones convencionales, y están limitadas en cuanto a tipos de materiales y número de registros de datos. Por ejemplo, el manual de Estandarización y Desarrollo de Propiedades de Materiales Metálicos (MMPDS) incluye cifras de 213 SN, 15 ε-N y 39 da/dN-ΔK para 62 tipos de materiales metálicos, que son aceptados para su uso en la Administración Federal de Aviación (FAA). ), Departamento de Defensa (DoD) y Administración Nacional de Aeronáutica y del Espacio (NASA)5. La hoja de datos de fatiga del Instituto Nacional de Ciencias de los Materiales (NIMS) que comenzó en 1978 en Japón alberga 126 hojas de propiedades de fatiga para 59 tipos de materiales metálicos6.
Las condiciones de prueba y preparación de muestras estandarizadas suprimen la mayoría de las fuentes externas de incertidumbres en los datos de fatiga y conservan gran parte de la correlación entre el rendimiento del material y los tipos de materiales, así como las condiciones ambientales y de carga. Los datos de fatiga informados, sin embargo, todavía muestran una naturaleza muy dispersa de las variaciones en las microestructuras de los materiales. Desde una perspectiva complementaria, el análisis estadístico de esta naturaleza dispersa basado en un gran volumen de datos puede ofrecer información clave sobre el rendimiento material que no se puede alcanzar por otros medios7.
La fabricación aditiva (FA) es una técnica sencilla para fabricar componentes estructurales con flexibilidad en el diseño estructural y beneficios en el costo y el tiempo de entrega8 (Fig. 1b). El control microestructural ofrece una excelente ruta para explorar la relación procesamiento-microestructuras-rendimiento (PMP)9,10. En las últimas décadas, se han realizado esfuerzos significativos para explorar los límites de rendimiento de las aleaciones AM, especialmente en su comportamiento a la fatiga11. Es bien sabido que las condiciones de la superficie, los defectos internos y otras características microestructurales afectan fuertemente el desempeño de fatiga de las aleaciones AM, pero la comprensión de la relación PMP sigue siendo en gran medida cualitativa12,13. Tanto la física-14,15 como los enfoques basados en aprendizaje automático (ML)16,17 se desarrollaron para resolver este problema, que exige datos de fatiga confiables para la verificación y validación del modelo (V&V). Aunque el volumen de datos es mucho menor que el informado para las aleaciones producidas mediante técnicas convencionales como la fundición y la forja, se han publicado miles de artículos sobre el rendimiento de fatiga de las aleaciones AM, que proporcionan un subconjunto completo de datos para el análisis. Estudios recientes recolectaron y analizaron datos de fatiga AM de aleaciones AM seleccionadas (por ejemplo, Ti-6Al-4V, AlSi10Mg/AlSi7Mg, 316 L) de la literatura18,19,20,21. Sin embargo, no se publicaron conjuntos de datos para el procesamiento y análisis de datos de seguimiento. Además, la calidad de los resultados resumidos está limitada por el alcance específico de los estudios, y existe la necesidad de estándares o normas para informar sobre el comportamiento de fatiga de los materiales.
La ciencia abierta, incluida la publicación abierta, los datos y los recursos relacionados, se ha convertido recientemente en un consenso mundial para acelerar la investigación científica, promover la colaboración y beneficiar a la comunidad22,23. La digitalización y el desarrollo de acceso abierto ofrecen oportunidades completamente nuevas para estudios centrados en datos basados en datos bibliográficos, que pueden compilarse en bases de datos estructuradas y utilizarse, por ejemplo, en la selección de materiales y el diseño de ingeniería. En comparación con los datos publicados por instituciones autorizadas, los datos abiertos tienen su riqueza en las microestructuras materiales y las condiciones de prueba, lo que puede ser útil para obtener más información sobre la correlación PMP. Sin embargo, se espera heterogeneidad de datos al menos en la calidad de las muestras de prueba y el diseño de las pruebas de fatiga, que deben evaluarse para producir registros confiables. Los artículos de revistas, las actas de congresos y los informes técnicos forman un vasto corpus en continuo crecimiento de información no estructurada, que puede procesarse mediante técnicas de procesamiento de lenguaje natural (NLP) de última generación, ML y visión por computadora (CV). Se han observado avances en esta dirección, donde se liberaron bases de datos para recetas de síntesis de materiales24 y propiedades25,26,27.
En este trabajo, recopilamos datos de fatiga y datos relacionados informados para aleaciones AM, incluidos titanio, níquel, aluminio y acero de 3415 artículos científicos (hasta finales de 2022). Se utilizan códigos internos y de fuente abierta para la extracción de datos de figuras, tablas y texto. Se describe la descripción de la investigación y los datos informados de SN, ε-N y da/dN-ΔK. Para ilustrar el uso de los datos, se analiza el rendimiento de fatiga de las aleaciones AM, lo que ofrece sugerencias para futuras investigaciones y publicaciones de datos más efectivas.
Nuestro flujo de trabajo incluye la adquisición de contenido (búsqueda y descarga), la extracción de datos (de figuras, tablas y texto) y la construcción de bases de datos (Fig. 2). La base de datos contiene metadatos de artículos y datos científicos. Los metadatos incluyen información como autores, agencias de financiación y el año de publicación, que describen la historia del desarrollo, el estado del arte y la ciencia de la ciencia (SciSci)28. Los datos científicos describen el contenido de la investigación, como los tipos de materiales, los parámetros de AM, el procesamiento y las pruebas, las propiedades mecánicas estáticas y de fatiga, y su relación. Los datos científicos de cada artículo están organizados en conjuntos de datos de fatiga separados para los datos de SN, ε-N o da/dN-ΔK.
Flujo de trabajo para construir la base de datos de fatiga de aleaciones AM. Los artículos AM se buscan en la Web of Science (WoS) y se accede a ellos a través de sus identificadores de objetos digitales (DOI). Los tipos de materiales, los parámetros de AM, el procesamiento, las pruebas, así como las propiedades mecánicas estáticas y de fatiga se extraen de figuras, tablas y texto, y se estructuran en una base de datos jerárquica.
Los artículos que se centran en la fatiga AM se identifican en las bases de datos de citas y el texto completo se descarga de los editores. Las palabras clave para la fatiga AM se resumen y compilan en fórmulas de búsqueda (Tabla 1). En ciencia de materiales o mecánica de materiales, 'fatiga' generalmente cubre estudios sobre el comportamiento bajo cargas cíclicas y se utiliza como palabra clave de búsqueda. Para AM se utilizan una serie de sinónimos, ramas y sus abreviaturas, de acuerdo con la terminología encontrada en los estándares de AM29,30 y artículos de revisión31,32,33,34,35. La búsqueda se realiza en la base de datos de citas autorizada, Web of Science Core Collection (WoS), a través de los campos de 'título', 'resumen' y 'palabras clave de autor'. WoS devuelve 3.415 registros de artículos y sus metadatos se obtienen a través de la función 'exportar'. Se aplica un modelo NLP para la clasificación de los artículos según sus resúmenes36. Se descartan artículos como los que tratan sobre la 'fatiga' fisiológica o temas de investigación en campos irrelevantes. Tras la clasificación de PNL y el examen manual, se identifican 2.001 artículos candidatos.
Los identificadores de objetos digitales (DOI) en los metadatos proporcionan enlaces al texto completo. 104 de los 2001 artículos de fatiga AM no tienen DOI en los registros de WoS. Además, 22 artículos no están escritos en inglés y 27 artículos son de editoriales con menos de 10 publicaciones. Estos registros se descartan. Se descargan 1.848 artículos para su análisis y se utilizan para construir la base de datos. Los estudios sobre el rendimiento de fatiga de las aleaciones AM comenzaron después del año 2000, y la mayoría de los artículos se publican tanto en formato de documento portátil (PDF) como en formato de lenguaje de marcado extensible (XML)/lenguaje de marcado de hipertexto (HTML). Los archivos PDF y XML/HTML son más amigables para el examen manual y el análisis de código automatizado, respectivamente. Para Elsevier, se recuperan 1122 archivos PDF de artículos a través de la interfaz de programación de aplicaciones (API), lo que representa el 60 % de los artículos de fatiga AM descargados. Los archivos PDF de otras fuentes se recuperan mediante el código article-downloader37 (24 %), Scopus Document Download Manager (12 %) o manualmente desde los sitios de los editores (4 %). La API de Elsevier proporciona acceso a archivos XML (60 % de artículos). Los archivos HTML, si están disponibles, se recuperan de otros editores mediante el descargador de artículos de código (37 % de los artículos).
Los datos de fatiga (SN, ε-N y da/dN-ΔK) presentados como diagramas de dispersión en figuras o entradas en tablas se extraen y almacenan como pares de datos. Los diagramas de dispersión son más legibles y concisos que las tablas y se adoptan ampliamente en la literatura, aunque esta última presentación proporciona valores numéricos directos. Las figuras se extraen de los documentos PDF usando PyMuPDF. Las figuras que contienen datos de fatiga se analizan y las que tienen varios gráficos se segmentan manualmente en gráficos únicos. Los puntos de datos dispersos se extraen mediante un código interno de MATLAB IMageEXtractor (IMEX). El código permite la extracción de datos automática y manual y permite la corrección manual posterior. La función de extracción automática incluye calibración de ejes, análisis de leyendas y reconocimiento de datos empleando técnicas CV.
Las cifras (98 % publicadas en color) se procesan previamente en imágenes en escala de grises y se binarizan utilizando un umbral de escala de grises del 80 % para mejorar la eficiencia del procesamiento de imágenes en la extracción automática (Fig. 3a). Las versiones en color, en escala de grises y binarizadas de las figuras se almacenan y seleccionan para su uso en condiciones específicas. Los grupos de píxeles negros conectados en las imágenes binarizadas se encuentran y almacenan como componentes de figura (FC). El cuadro delimitador (BB) de un FC se define como una región rectangular definida por sus píxeles más a la izquierda, más a la derecha, más arriba y más abajo (Fig. 3a).
Extracción de datos de figuras y textos. (a) Las figuras de color RGB se convierten a escala de grises y luego se binarizan, donde los grupos de píxeles negros conectados se detectan como componentes de figura (FC). Sus cuadros delimitadores (BB) se muestran mediante cuadros verdes. (b) Los ejes se detectan en las figuras y las leyendas se analizan para obtener los símbolos y etiquetas de datos. Los símbolos de las leyendas se utilizan como plantillas para el reconocimiento de datos. Los cuadros rojos en cada panel indican los objetos que se reconocerán en los pasos del procesamiento de datos. (c) Diagrama de flujo de clasificación y extracción de datos de texto.
La calibración del eje genera las posiciones de los ejes, las etiquetas de los ejes, las escalas de los ejes, las marcas y las etiquetas de las marcas. El sistema de coordenadas xy (CS) constituye el FC más grande, medido por el área debajo de su BB. Los ejes x e y se identifican como líneas de más del 70 % de la figura escaneando el FC más grande en las direcciones vertical y horizontal. Las líneas perpendiculares a los ejes se reconocen como marcas. Las etiquetas se extraen mediante reconocimiento óptico de caracteres (OCR)38 y se asignan a los ejes y ticks según sus posiciones. Las escalas de los ejes (lineal/logarítmica) se determinan según la posición y la etiqueta de las marcas.
Las regiones de la leyenda se seleccionan manualmente en el estudio actual, ya que las posiciones y los diseños de las leyendas varían de una figura a otra. En la región seleccionada, los símbolos de los puntos de datos se reconocen y almacenan como plantillas, y las etiquetas de leyenda se marcan. Los píxeles que contienen puntos de datos en el CS se reconocen de acuerdo con los códigos de color de las plantillas. Los datos informados en la representación binaria se reconocen mediante las formas. En el 55% de los datos da/dN-ΔK, los símbolos están densamente dispuestos y sus formas no se pueden distinguir. En consecuencia, solo se almacenan los píxeles extraídos con los códigos de color. Todos los datos de SN, ε-N y el 45% restante de da/dN-ΔK se extraen de acuerdo con el color y la forma que son consistentes. Los píxeles extraídos se comparan con las formas de las plantillas para detectar los tipos de símbolos. Los centroides de estos símbolos luego se extraen como puntos de datos. El método de extracción de datos ("color y forma", "color" o "forma") se registra en la base de datos. Los ejes, leyendas y datos extraídos se visualizan y corrigen manualmente en IMEX. Los datos extraídos de las figuras se convierten de unidades de píxeles a unidades físicas según la posición y la escala de las marcas. Las marcas en dos extremos de los ejes se eligen como referencias para minimizar el error al determinar las ubicaciones.
El rendimiento de la extracción de datos de figuras se puede evaluar mediante las métricas
donde TP denota el verdadero positivo o el número de datos extraídos correctamente, FP es el falso positivo o el número de datos extraídos incorrectamente y FN es el falso negativo o el número de datos que no se extraen. La puntuación F1 es la media armónica de precisión y recuperación. Las métricas de calibración de ejes, análisis de leyendas y reconocimiento de datos se resumen en la Tabla 2. Encontramos que el reconocimiento de datos tiene un desempeño inferior al de calibración de ejes y análisis de leyendas debido a las dificultades técnicas para analizar puntos de datos superpuestos.
Los datos de fatiga en menos del 5% de los artículos se informan en tablas. Por lo tanto, las tablas se utilizan en este trabajo solo para verificar los datos extraídos de las figuras. Son de interés las tablas que contienen parámetros de AM, procesamiento, pruebas, así como propiedades mecánicas estáticas y de fatiga, que se pueden identificar a partir de los títulos de las tablas. Las tablas en archivos XML/HTML son analizadas por el extractor de tablas39, mientras que las incrustadas en los archivos PDF se procesan manualmente. Las métricas de evaluación de la extracción de datos de la tabla se resumen en la Tabla 2. La puntuación F1 es del 60 %, que no es alta dado que se incluyen datos de aleaciones que no son AM o datos de referencias externas. La combinación de información de texto en el procesamiento de datos en las tablas podría mejorar el rendimiento.
El procesamiento de texto incluye la clasificación de texto y la extracción de datos (Fig. 3b). Los archivos de texto estructurado en formato XML/HTML se procesan utilizando nuestros códigos de análisis internos TEXTract (adaptados a los estilos estándar proporcionados por los editores) y en combinación con los paquetes de Python xml.dom.minidom para XML y BeautifulSoup para HTML. PDFDataExtractor40 extrae el texto de los archivos PDF si los archivos XML/HTML no están disponibles.
La clasificación de textos se realiza para resúmenes y párrafos utilizando la biblioteca Simple Transformer de NLP. El enfoque de preentrenamiento de BERT robustamente optimizado (RoBERTa)36, un modelo mejorado de la representación de codificador bidireccional de transformadores (BERT)41 preentrenado, se utiliza para transformar secuencias de texto en vectores incrustados de resumen o párrafos. Los vectores de incrustación se pasan a una red neuronal completamente conectada con una capa lineal y neuronas de salida correspondientes a las etiquetas de clase. Los modelos RoBERTa y de clasificación están integrados en un módulo de clasificación en Simple Transformer. El modelo se entrena en artículos de fatiga AM con el optimizador AdamW42 utilizando una función de pérdida de entropía cruzada y una tasa de aprendizaje de 4 × 10−5. La clasificación de resúmenes identifica artículos sobre fatiga de AM a partir de los resultados de búsqueda de WoS en función de un conjunto de datos etiquetado manualmente de 500 resúmenes, con etiquetas de clase de 'fatiga de AM' y 'fatiga que no es de AM'. Los párrafos se clasifican en clases 'Método' y 'Sin método' y se pasan a la extracción de datos. Los párrafos de 'Método' incluyen información de materiales, parámetros de AM, procesamiento y pruebas. El conjunto de capacitación que consta de 3.350 párrafos de 82 artículos se construye a partir de secciones con palabras clave de 'método', 'fabricación', 'proceso', 'prueba' y 'experimento' en sus encabezados. Tanto los conjuntos de datos de resumen como los de párrafo se dividen en conjuntos de entrenamiento/prueba/validación con una proporción de 0,8:0,1:0,1.
Los datos que incluyen los tipos de materiales, los parámetros de AM, el procesamiento, las pruebas y las propiedades mecánicas estáticas se extraen del texto. Para identificar los tipos de materiales, se aplica el reconocimiento de entidades químicas nombradas (NER) de ChemDataExtractor 2.043 junto con un diccionario de nombre comercial de aleaciones, elaborado de acuerdo con MMPDS-175 y el conocimiento del dominio. El alcance del reconocimiento de materiales AM contiene párrafos de título, resumen y método. Para las entradas de datos de AM, procesamiento y pruebas, las palabras clave se resumen y organizan en expresiones regulares (RE) para extraer datos de los párrafos de 'Método'. En un dominio específico como la fatiga AM, donde las variantes de palabras clave y patrones de oraciones para los datos objetivo son limitadas, es relativamente fácil construir los RE. En la práctica, una cantidad física puede estar asociada con varias entradas de datos. Por ejemplo, las 'temperaturas' son relevantes para las especificaciones de los procedimientos AM, el tratamiento térmico y las pruebas de fatiga. Por lo tanto, los datos extraídos se asignan a entradas de acuerdo con palabras clave definidas manualmente en las oraciones actuales y anteriores, como 'fabricar' para procedimientos AM, 'tratamiento térmico' para tratamiento térmico y 'prueba' para pruebas de fatiga. Las propiedades mecánicas estáticas como el módulo de Young, el límite elástico (YS), la resistencia máxima a la tracción (UTS) y el alargamiento se identifican mediante RE en los párrafos del "Método" y las secciones posteriores. Las métricas de evaluación de la clasificación de textos y la extracción de datos se resumen en la Tabla 2. Tanto la clasificación de resúmenes como la de párrafos obtienen una puntuación F1 superior al 80 %. La puntuación F1 de la extracción de datos es del 63 %, que no es alta, ya que es difícil introducir de forma eficaz la información de contexto en el enfoque de ER basado en reglas. El procesamiento de figuras, tablas y texto logra así un buen desempeño en las tareas de calibración de ejes, análisis de leyendas y clasificación de textos. El rendimiento de la extracción de datos se puede mejorar refinando las reglas de análisis, empleando el análisis de dependencia o utilizando modelos NLP avanzados como el Transformador preentrenado generativo (GPT). GPT-3 es un gran modelo de lenguaje preentrenado con 175 000 millones de parámetros con un rendimiento mejorado del aprendizaje de pocos disparos44, lo que reduce la necesidad de datos específicos de la tarea y experiencia en PNL. Con un ajuste fino, GPT-3 tiene el potencial de extraer datos estructurados de textos científicos complejos con una puntuación F1 >80 %45. La capacidad de GPT-4 se eleva aún más, especialmente en tareas complejas46. Quedan por explorar sus aplicaciones a los datos de fatiga.
Para construir la base de datos, los datos de fatiga extraídos de las figuras deben correlacionarse con las entradas de datos de materiales, AM, procesamiento, pruebas y propiedades mecánicas estáticas extraídas del texto y las tablas. La mayoría de las entradas de datos no varían en la investigación específica reportada en un artículo. Los valores únicos extraídos para una entrada de datos específica se asignan a todos los conjuntos de datos relacionados con el artículo. Para las entradas de datos con valores múltiples, la asignación se realiza de acuerdo con las etiquetas de la leyenda.
A diferencia de las propiedades mecánicas estáticas, los datos de fatiga son más sensibles a las condiciones de fabricación, procesamiento y prueba, lo que genera dispersión de datos. En consecuencia, aunque las puntuaciones F1 de la extracción de datos se pueden mejorar mediante el uso de técnicas avanzadas, el rendimiento aún puede ser insuficiente para establecer bases de datos de alta calidad para el análisis de fatiga en ingeniería. En este trabajo, abordamos este problema a través del examen y corrección manual. Para los datos de fatiga, primero corregimos los datos utilizando nuestra interfaz IMEX y luego imprimimos los datos para compararlos con los de las cifras de origen. Para entradas relacionadas con materiales, AM, procesamiento, pruebas y propiedades mecánicas estáticas, exportamos los datos a un archivo EXCEL y los comparamos con los archivos PDF. Además del examen y la corrección de datos, el trabajo manual también implica la selección y segmentación de figuras y la selección de regiones de leyendas. Extraemos el tamaño y la forma de las muestras durante el examen manual, ya que la mayoría de ellas se presentan en cifras en lugar de texto. Examinar el texto es la parte dominante del trabajo manual, y un experto en la materia puede procesar de 4 a 8 artículos por hora. Un sistema automatizado de anotación y corrección de datos multimodal (figuras, tablas y textos) podría reducir la carga de trabajo. Los informes de datos estandarizados coordinados por los autores, editores y usuarios de datos también pueden facilitar la construcción de bases de datos.
En las pruebas experimentales para medir los datos de SN y ε-N, se utilizan la amplitud (σa o εa) y la tensión/deformación máxima (σmax o εmax), que se pueden relacionar a través de
En el estudio actual, los máximos (35 % de la base de datos completa) se convierten en amplitudes a través de la relación de carga
Para los datos da/dN-ΔK, el rango SIF es
Para el análisis, los datos de fatiga dispersa de las relaciones SN y ε-N se ajustan suponiendo una distribución logarítmica normal con una varianza constante siguiendo la norma ASTM E739-1047, es decir
donde A y B son los parámetros de ajuste. La relación SN se puede convertir a la forma de la ecuación de Basquin
donde A1 y B1 son los parámetros de ajuste.
Los datos da/dN-ΔK se ajustan mediante la ecuación de París
donde C y m son los parámetros de ajuste.
La base de datos FatigueData-AM202248 recopila datos experimentales de SN, ε-N y da/dN-ΔK de aleaciones AM. No se incluyen los estudios sobre componentes estructurales o materiales arquitectónicos49,50. Los datos se recopilan para ensayos de fatiga en condiciones uniaxiales o de flexión. El rendimiento de fatiga bajo cargas variables, torsionales y multiaxiales se informa en solo unos pocos estudios en esta etapa y no se incorporan para mantener la integridad de los datos. La base de datos FatigueData-AM202248 está disponible como archivos MAT (MATLAB), JSON y EXCEL en https://doi.org/10.6084/m9.figshare.22337629. Los archivos MAT y JSON están formateados en una estructura de árbol jerárquico. Los nodos del árbol que almacenan directamente valores de datos se denominan entradas de datos. Las entradas de datos incluyen tipos de datos numéricos y de cadena. Los datos de texto, como títulos, tipos de AM y pruebas de fatiga, se almacenan como cadenas. Los datos con varias cadenas, como autores, países e instituciones, se almacenan como matrices de cadenas. El año de publicación se define como un número numérico, y otros datos numéricos, como datos de fatiga, parámetros de AM y relaciones de carga, se almacenan en forma de matrices numéricas. Los nodos de árbol utilizados para agrupar entradas de datos se denominan estructuras de datos. Varias estructuras, como artículos o conjuntos de datos de fatiga, se organizan en matrices de estructuras. Para facilitar la implementación de la programación y la adquisición de datos, se definen claves para entradas de datos, estructuras y matrices de estructuras (Fig. 4 y tablas 3–5).
La estructura de la base de datos FatigueData-AM2022. La base de datos FatigueData-AM2022 está formateada en una estructura de árbol jerárquico. El nombre de cada nodo del árbol está resaltado en color amarillo. Las claves se definen para facilitar el acceso mediante secuencias de comandos. Cada nodo tiene su tipo de datos específico. Dos gráficos circulares muestran las estadísticas de los artículos descargados y los tipos de conjuntos de datos de fatiga.
La estructura de la base de datos FatigueData-AM202248 se resume en la Fig. 4. El nodo raíz es la base de datos, que contiene nodos secundarios de artículos y un sistema de unidades predeterminado (por ejemplo, MPa para tensión, °C para temperatura, μm para espesor de capa, W para fuerza). Los datos numéricos sin procesar se convierten a las unidades predeterminadas de las entradas de datos. Los artículos se almacenan como una matriz de estructuras y cada artículo contiene dos estructuras de metadatos y datos científicos. Los metadatos contienen entradas de datos como los títulos y los autores de los artículos. Los datos científicos almacenan una matriz estructural de conjuntos de datos de fatiga, cada uno de los cuales se obtiene de pruebas experimentales en diferentes condiciones. Un conjunto de datos de fatiga contiene 6 estructuras (fatiga, materiales, AM, procesamiento, prueba y propiedades mecánicas estáticas), bajo las cuales se definen múltiples entradas de datos, estructuras o conjuntos de estructuras (Tabla 3). Se asigna una puntuación de calificación a cada conjunto de datos de fatiga para medir la calidad de los datos, que se explicará en la siguiente sección. La estructura de los parámetros AM y los parámetros de procesamiento depende de su tipo, como se muestra en las Tablas 4 y 5, respectivamente. Los parámetros de procesamiento están organizados como una matriz de estructura, 'proc_para', ya que puede contener varios pasos. La secuencia de procesamiento se registra en la matriz 'proc_seq'. Los parámetros de procesamiento se pueden identificar en la matriz 'proc_para' a través de la entrada de índice en 'proc_seq'.
La terminología de los tipos de datos se hereda en gran medida de MATLAB (el archivo MAT). Las excepciones son las matrices de cadenas y la matriz struct de parámetros de procesamiento, que corresponden a matrices de celdas en el archivo MAT. Para el archivo JSON, la estructura se define como un diccionario y todos los tipos de matrices se definen como listas. La base de datos FatigueData-AM202248 también se aplana en un archivo EXCEL, que incluye 4 hojas de trabajo. Las hojas de cálculo de 'S-N', 'e-N' y 'dadn' almacenan datos de SN, ε-N y da/dN-ΔK, respectivamente. En estas 3 hojas de trabajo, cada fila almacena el índice de un conjunto de datos de fatiga y un descriptor de datos (S/ε, N y el indicador de agotamiento para 'S-N'/'e-N', da/dN y ΔK para 'papá'). Los datos da/dN-ΔK extraídos por color almacenan todos los píxeles coincidentes. El número de puntos de datos excede el número máximo de filas permitido por EXCEL (1,048,576). Como resultado, se muestrean 500 puntos de datos de cada conjunto de datos y luego se registran. En la cuarta hoja de trabajo de 'parámetro', cada fila almacena el índice de un conjunto de datos de fatiga y su contenido. Cada columna corresponde a una entrada de datos. Los datos de la hoja de trabajo de 'parámetros' están vinculados a los otros tres a través del índice de conjuntos de datos de fatiga.
Con la estructura de la base de datos descrita anteriormente, las entradas de datos se explican aquí en detalle. La matriz de 'datos de fatiga' almacena N o ΔK en la primera columna, y los valores de σa, εa o da/dN en la segunda columna. εa representa la amplitud de la deformación total, incluidos los componentes elásticos o plásticos. La tercera columna almacena el indicador de agotamiento para los datos de SN y ε-N, donde '1' indica que la prueba se detiene antes de fallar (agotamiento) y '0' indica falla. La vida de fatiga y la tasa de FCG son sensibles a la anisotropía del material. En este trabajo, la dirección de los especímenes se mide por un ángulo entre la plataforma de construcción en AM y la dirección de carga51. El efecto del tamaño de las muestras AM podría ser significativo debido a la precisión limitada de la impresión, la presencia de defectos y la tensión residual52,53,54. El tamaño de la sección transversal crítica almacena el diámetro de las muestras con secciones transversales circulares, los diámetros exterior e interior de las muestras con secciones transversales anulares y el ancho y el espesor de las secciones transversales rectangulares, respectivamente. Las formas de las secciones transversales se almacenan en la descripción de los especímenes ('spec_desc'). En las matrices numéricas de otras entradas de datos, un solo valor representa un valor específico o la media, y dos valores representan el límite inferior y superior, respectivamente.
Para facilitar la comparación entre cadenas de datos, se utiliza una nomenclatura unificada para entradas de datos como tipos de AM, materiales, máquinas, afiliaciones y agencias de financiación. El 98 % de los tipos de FA se pueden clasificar en cuatro categorías: fusión de lecho de polvo por láser (L-PBF), fusión de lecho de polvo por haz de electrones (E-PBF), deposición de energía dirigida a base de polvo (P-DED) y deposición de energía dirigida (W-DED). Otros tipos de AM se registran por sus nombres, como chorro de aglomerante y extrusión de metal. El tipo de materia prima predeterminado es "polvo" para L-PBF, E-PBF y P-DED, y "alambre" para W-DED.
En nuestra base de datos, las entradas de datos que no se informan explícitamente se registran como matrices vacías (MAT), listas (JSON), cadenas (MAT y JSON) o celdas (EXCEL). 'As-built' se asigna al tratamiento superficial, 'NHT' se asigna al tratamiento térmico y '25 °C' se asigna a la temperatura de precalentamiento si no se aplican (NA). También asumimos que las pruebas son uniaxiales y se realizan en un entorno ambiental (25 °C, aire) con un factor de concentración de tensión, Kt = 1 si no se especifica. El control de carga predeterminado es 'fuerza' para SN, 'deformación' para ε-N, 'carga' para da/dN-ΔK y 'desplazamiento' para fatiga de ciclos muy altos (VHCF), independientemente de los tipos de datos. Se sugiere que los procedimientos o configuraciones opcionales se indiquen como NA al informar los datos de fatiga si no se indica específicamente.
En resumen, la base de datos FatigueData-AM202248 cubre 116 tipos de aleaciones AM en total. 459 artículos informan 1610 conjuntos de datos SN con 15 146 puntos de datos, 79 artículos informan 236 conjuntos de datos ε-N con 1840 puntos de datos y 135 artículos informan 614 conjuntos de datos da/dN-ΔK (Fig. 4). El 65 % de los datos son datos de SN utilizados para medir la vida útil a la fatiga en el régimen HCF y para el diseño de vida segura55,56,57. Los componentes críticos en la industria aeroespacial y energética en condiciones adversas también requieren datos de ε-N y da/dN-ΔK.
Las métricas de rendimiento del procesamiento de figuras, tablas y texto muestran que las puntuaciones F1 de la extracción automatizada son ~60–90 % (Tabla 2). Todos los registros de datos se examinan y corrigen manualmente para producir una base de datos de alta calidad. La inspección posterior de 50 artículos elegidos al azar muestra que la precisión ha mejorado a >98 %.
Uno de los problemas prácticos en la extracción de datos de las figuras es la distorsión de los símbolos y las marcas de los ejes después de la pixelación, lo que dificulta determinar las posiciones de los centroides con alta precisión. La comparación de los datos de SN y ε-N extraídos de las figuras y los de las tablas, si ambos fueron publicados, muestra inconsistencia en menos del 5% de los 40 artículos debido a las incertidumbres en la ubicación de los puntos de datos. Los parámetros de ajuste de datos usando Eq. 8 se comparan con los valores informados en los artículos, mostrando también una inconsistencia <5%.
Los datos representativos y sus estadísticas se trazan en la Fig. 5 a modo de ilustración y la calidad de los datos se evalúa mediante el conocimiento del dominio. Los datos de SN para las 4 aleaciones AM más reportadas (Ti-6Al-4V, 316 L, AlSi10Mg e IN718) se incluyen en la Fig. 5a y la vida de fatiga disminuye a medida que aumenta la amplitud de la tensión. La resistencia a la fatiga de las aleaciones Ti-6Al-4V e IN718 es superior, seguida de 316 L y AlSi10Mg (Fig. 5a). La estadística de materiales, tipos de AM y tratamiento de superficie de conjuntos de datos SN se resumen en la Fig. 5b. Ti-6Al-4V ocupa el 90 % de los datos para aleaciones de titanio AM e IN718 ocupa el 77 % para aleaciones de níquel AM. El alto porcentaje de ocupaciones proviene de su predominio en las aleaciones convencionales de titanio y níquel para procedimientos de fabricación maduros y de alta resistencia58,59. Aunque AlSi10Mg no es muy popular entre las aleaciones de aluminio convencionales, representa el 66 % de las aleaciones de aluminio AM debido a su buena capacidad de impresión60. El 316 L representa solo el 43 % de los aceros AM y otros tipos también participan, lo que indica la diversidad en las aplicaciones de los aceros61. Se observa que la mayoría de las probetas de fatiga son preparadas por PBF, especialmente L-PBF (83%), que es la técnica AM más madura y comercializada (Fig. 5b)61. El proceso de impresión capa por capa y la naturaleza no equilibrada de AM pueden dar como resultado una calidad de superficie deficiente, a la que son susceptibles los datos de SN. Se investigan diferentes tipos de tratamiento de superficie (Fig. 5b).
Datos representativos. ( a ) Conjuntos de datos SN representativos de 4 aleaciones AM principales, Ti-6Al-4V, IN718, 316 L y AlSi10Mg. ( b ) Estadísticas de aleaciones AM investigadas para los datos SN. El eje x está marcado por el elemento principal de las aleaciones o sus tipos. 'MPEA' denota aleaciones de múltiples elementos principales. 'Híbrido' denota materiales híbridos o graduados. El recuadro muestra gráficos circulares de tipos de AM y condiciones de superficie, donde 'PBF' indica fusión de lecho de polvo, 'L-PBF' indica PBF láser, 'E-PBF' indica PBF de haz de electrones y 'DED' indica deposición de energía dirigida. Datos representativos (c) ε-N y (d) da/dN-ΔK de las principales aleaciones AM.
Los datos representativos de ε-N y da/dN-ΔK se muestran en la Fig. 5c, d. La vida de fatiga disminuye a medida que aumenta la amplitud de la deformación (Fig. 5c), y la tasa de FCG aumenta con el rango SIF (Fig. 5d). La calidad de los datos se evalúa aún más mediante la relación entre los datos de fatiga y otras propiedades de las aleaciones, lo que se demuestra aquí usando los datos de SN como ejemplo. La relación entre la resistencia a la fatiga (σf) y la UTS (σu) y los efectos de las condiciones de carga y procesamiento son bien conocidos para las aleaciones convencionales2,62,63. La Fig. 6a confirma la correlación positiva entre σf y σu, es decir, un valor alto de σu indica una alta resistencia a la fatiga al suprimir la acumulación de daño. La relación entre σf y σu (0,2–0,7) para las aleaciones AM es cercana a la de las aleaciones convencionales (0,25–0,65)2.
Validación de datos. (a) Relación entre la resistencia a la fatiga medida después de 106 ciclos, σf, y la resistencia última a la tracción (UTS), σu. Las referencias σf = 0.2σu y σf = 0.7σu se agregan como líneas discontinuas. (b) El efecto de la relación de tensión, R, en las relaciones SN de AM Ti-6Al-4V.
Las pruebas de SN se realizan comúnmente en relaciones de tensión específicas, Rσ, lo que podría introducir el efecto de la tensión media, σm = (σmax + σmin)/2. La relación entre Rσ y σm se puede derivar de la ecuación. 5, que es \({R}_{\sigma }=1-\frac{2{\sigma }_{{\rm{a}}}}{{\sigma }_{{\rm{m}} }+{\sigma }_{{\rm{a}}}}\). La figura 6b muestra el rendimiento de AM Ti-6Al-4V probado bajo Rσ = −1 (σm = 0) y 0,1 (σm = 0,55σmax). La tensión de tracción media reduce la resistencia a la fatiga incluso bajo una fuerte dispersión de datos, lo que también concuerda con el conocimiento del dominio de las aleaciones convencionales.
Existen limitaciones en las aplicaciones de las bases de datos de fatiga construidas a partir de fuentes abiertas en comparación con los conjuntos de datos publicados por instituciones autorizadas. Además de la diversidad en la fabricación de materiales, la preparación de muestras y el acabado superficial de los especímenes, la incompatibilidad en los estándares de prueba y los registros incompletos también generan dificultades para mejorar la calidad de los datos, así como la integración con bases de datos autorizadas o nuevos datos. reportado en la literatura. Se introduce un sistema de clasificación de los datos que se utilizarán en el diseño de la integridad estructural. Las entradas de datos se pueden asignar con pesos de acuerdo con el conocimiento del dominio o su covarianza con los datos de fatiga. También podrían introducirse medidas adicionales como el número de datos de fatiga47, el número de citas de la publicación y la precisión de la extracción de datos. Para cada conjunto de datos de fatiga, se calcula una puntuación de calificación entre 0 y 1 como la suma ponderada de las entradas no vacías. El algoritmo de puntuación es subjetivo y dejamos este trabajo a los usuarios de datos. Aquí, en aras de la simplicidad, asumimos pesos iguales para todas las entradas (Fig. 7a). El tratamiento superficial y térmico (incluidos HIP y NHT) se consideran dos entradas separadas de parámetros de procesamiento. Encontramos que la mayoría de los conjuntos de datos se clasifican con puntajes que van de 0,5 a 0,9, ya que no todas las entradas de datos están documentadas. El 87% de los conjuntos de datos tienen puntuaciones superiores a 0,6, que contienen información esencial, como tipos de materiales, tipos de AM y pruebas de fatiga. Las tasas de llenado (FR) de las entradas de datos contadas en todos los conjuntos de datos miden la calidad de la base de datos (Fig. 7b), que se espera que no sea alta para la diversidad de fuentes de datos. Los tipos de materiales (p. ej., Ti-6Al-4V, IN718), AM (p. ej., PBF, DED), pruebas de fatiga (p. ej., uniaxial, flexión) y relaciones de carga son información esencial y se proporcionan en la mayoría de los artículos de fatiga de AM. Para las entradas de datos relacionadas con AM y procesamiento, los FR de la máquina AM, el espesor de la capa, la dirección de las muestras, el tratamiento térmico y el tratamiento superficial son superiores al 70 %, mientras que otras entradas están menos completas. Para las pruebas de fatiga, el 80 % de los artículos informaron la frecuencia de carga, ya que en la práctica podría variar en 4 órdenes de magnitud. Los efectos de la frecuencia podrían ser significativos a medida que se introduce el efecto de calentamiento, por ejemplo, por disipación plástica en LCF o vibración en VHCF. Además, la velocidad de deformación es proporcional a la frecuencia a la que los procesos de daño pueden ser susceptibles y, en un ambiente corrosivo, la degradación del material también depende de la velocidad64,65. Sorprendentemente, solo el 40% de los artículos informaron el estándar de prueba de fatiga que siguieron. Teniendo en cuenta la variación en las microestructuras y las condiciones de la superficie (tal como están construidas), se debe evaluar la implementación de los estándares de prueba de fatiga tradicionales para la investigación de fatiga AM66. Los nuevos diseños de especímenes, por ejemplo, en tipos en miniatura67, y las técnicas de prueba como VHCF también merecen una discusión más detallada. Los FR de las propiedades mecánicas estáticas no superan el 50% ya que la dispersión de datos no es alta.
Calidad de los datos medida por puntajes de calificación y tasas de llenado. (a) El histograma de los puntajes de calificación para los conjuntos de datos de fatiga, donde todas las entradas de datos tienen la misma ponderación. (b) Las tasas de llenado (FR) de los tipos de materiales, parámetros de AM, procesamiento, prueba y propiedades mecánicas estáticas. (c) El lenguaje unificado de datos de fatiga (ULFD).
Nuestros resultados resaltan la necesidad de estándares para las pruebas de fatiga AM, así como normas para informar datos en revistas, actas de conferencias e informes técnicos, que son cruciales para el desarrollo de bases de datos de alta calidad y la investigación centrada en datos. Aquí se sugiere un lenguaje unificado de datos de fatiga (ULFD) de acuerdo con los estándares relacionados para AM, procesamiento y prueba68. La base de datos actual se puede exportar utilizando ULFD (Fig. 7c), que no solo describe el flujo de trabajo de la construcción de la base de datos, sino que también guía el análisis de datos y la planificación experimental.
La dispersión de datos y la desviación del sistema deben tenerse en cuenta al analizar los datos de fatiga informados en la literatura. Por ejemplo, la resistencia a la fatiga de AM Ti-6Al-4V no solo es inferior a la de su contraparte convencional, como se informa en la base de datos NIMS, sino que también muestra una mayor dispersión (Fig. 8a). La comparación con los datos de MMPDS lleva a la misma conclusión. Para cuantificar el grado de dispersión, la función de densidad de probabilidad log-normal \({p}_{{\rm{f}}}\left(x\right)=\frac{1}{s\sqrt{2\pi }}\exp \left[-\frac{1}{2}{\left(\frac{ln(x)-\mu }{s}\right)}^{2}\right]\) se asume y ajustado usando la Ec. 9 para calcular la media, μ y la varianza, s de la resistencia a la fatiga después de 106 ciclos (Fig. 8b). Los valores de s para los conjuntos de datos oscilan entre 1,6 × 10−4 y 45,1 × 10−4, la mayoría de los cuales son más altos que los valores de la clase NIMS 1100 (3,1 × 10−4) y la clase 900 para Ti-6Al-4V ( 1,7 × 10−4). Los datos AM están más dispersos que los datos NIMS, independientemente de los tipos de materiales, lo que puede atribuirse a la diversidad de microestructuras de materiales, incluidos los defectos. La optimización de los parámetros AM o los procedimientos de posprocesamiento podría reducir la dispersión del rendimiento de la fatiga y servir mejor a las aplicaciones críticas. Aunque muestran una naturaleza más dispersa en comparación con las bases de datos autorizadas, los datos AM recopilados de la literatura aún brindan información clave sobre las propiedades del material y las pautas para el diseño de fatiga (Fig. 5).
Dispersión de datos y desviación del sistema. ( a ) La comparación entre los datos SN de aleaciones AM extraídos de la literatura y los datos NIMS publicados para Ti-6Al-4V bajo la relación de estrés R = −1. 'clase 1100' indica que el UTS está en el nivel de 1100 MPa y 'clase 900' indica 900 MPa. (b) La función de densidad de probabilidad, pf, de la resistencia a la fatiga, σf, después de 106 ciclos para los conjuntos de datos en (a), normalizada por los máximos. Los datos NIMS se muestran en el panel superior y los datos AM en el panel inferior. Para los datos AM, las líneas indican los datos ajustados de conjuntos de datos independientes y el área sombreada recopila todos los datos. ( c ) La comparación entre los datos de SN para aleaciones Ti-6Al-4V tratadas térmicamente (HT) y prensadas isostáticamente en caliente (HIP). Los conjuntos de datos se escalan en (d) de acuerdo con los datos de referencia (Ec. 11).
Además de la dispersión de datos, la Fig. 8b muestra que existe desviación del sistema entre los datos de fatiga de diferentes estudios. Por ejemplo, el prensado isostático en caliente (HIP) es un procedimiento efectivo de alta presión y alta temperatura para reducir los defectos internos (porosos) en las aleaciones, lo que mejora su rendimiento HCF al suprimir la iniciación de grietas. El efecto de HIP en el rendimiento de fatiga se compara con el del tratamiento térmico ordinario que opera a temperaturas más bajas sin presurización (Fig. 8c). Los dos conjuntos de datos difícilmente se pueden distinguir debido no solo a la dispersión de datos, sino también a la desviación del sistema que resulta de las diferencias en los procedimientos de prueba y preparación de muestras. Para resolver este problema, se selecciona como referencia uno de los datos de fatiga de HIP publicados. Luego, todos los datos de fatiga de HIP se ajustan mediante la ecuación de Basquin (Ec. 9) y se escalan a la referencia. El factor de escala para σa en ciclos específicos N se calcula como
donde el superíndice 'ref' denota los datos de referencia. Los datos del tratamiento térmico (HT) luego se escalan usando el valor de α para los datos HIP informados en los mismos artículos, es decir, \({\sigma }_{{\rm{a}}}^{{\rm{ HT}},{\rm{escalado}}}=\alpha {\sigma }_{{\rm{a}}}^{{\rm{HT}}}\). Los resultados muestran claramente que HIP supera a HT en la mejora del rendimiento de HCF, donde la vida de fatiga está controlada por el inicio de grietas (Fig. 8d). Sin embargo, HT parece ser superior para LCF (N < 104), donde la deformación plástica es crucial. Esto puede explicarse por el proceso de engrosamiento de grano en HIP, que debilita la resistencia de las aleaciones a la deformación plástica69.
Nuestra base de datos sienta las bases para la selección de materiales basada en datos y la estimación de la vida útil de los componentes AM, ofreciendo soluciones rentables para el diseño de ingeniería. El análisis crítico de las entradas en la base de datos ofrece información clave sobre la hoja de ruta técnica70, que podría optimizar la estrategia de inversión en investigación y desarrollo. Nuestra base de datos también puede servir como un conjunto de datos de entrenamiento para modelos NLP, ML y CV para mejorar el rendimiento de las predicciones del modelo. Además, el enfoque actual puede extenderse a otra información sobre aleaciones AM y datos de fatiga de otras aleaciones. Sin embargo, la extracción de datos de literatura anterior para aleaciones convencionales podría presentar desafíos en el procesamiento de archivos PDF basados en imágenes, donde tanto el texto como las figuras/tablas son de baja calidad y difíciles de extraer. El trabajo futuro se centrará en mejorar el nivel de automatización del flujo de trabajo actual y abordar los problemas de análisis de los primeros documentos.
Los scripts utilizados para extraer información de figuras, tablas y texto se basan principalmente en códigos de fuente abierta como ChemDataExtractor 2.043, table extractor39 y Simple Transformer (https://simpletransformers.ai/), respectivamente. Los scripts internos para la extracción y el análisis de datos se publican en el repositorio de GitHub (https://github.com/xuzpgroup/ZianZhang/tree/main/FatigueData-AM2022), que se pueden usar reconociendo el artículo actual y bajo la licencia MIT71. Estos scripts incluyen un tutorial detallado paso a paso para cargar y analizar el conjunto de datos en el repositorio.
Suresh, S. Fatiga de los materiales (Cambridge University Press, 1998).
Stephens, RI, Fatemi, A., Stephens, RR & Fuchs, HO Fatiga de metales en ingeniería (John Wiley & Sons, 2000).
Agrawal, A. et al. Exploración de técnicas de ciencia de datos para predecir la resistencia a la fatiga del acero a partir de parámetros de composición y procesamiento. Integrar Mate. Fabricación innovador 3, 90–108 (2014).
Artículo Google Académico
Yaghoobi, M. et al. Marco computacional de fatiga PRISMS para el análisis de fatiga en metales policristalinos y aleaciones. Cálculo npj. Mate. 7, 38 (2021).
Artículo ADS CAS Google Académico
Instituto Memorial Battelle. Desarrollo y estandarización de propiedades de materiales metálicos (MMPDS-17) (Battelle Memorial Institute, 2022).
Furuya, Y., Nishikawa, H., Hirukawa, H., Nagashima, N. & Takeuchi, E. Catálogo de hojas de datos de fatiga NIMS. ciencia Tecnología Adv. Mate. 20, 1055–1072 (2019).
Artículo PubMed PubMed Central Google Académico
Kononova, O. et al. Oportunidades y desafíos de la minería de textos en la investigación de materiales. iScience 24, 102155 (2021).
Artículo ADS PubMed PubMed Central Google Scholar
Herzog, D., Seyda, V., Wycisk, E. y Emmelmann, C. Fabricación aditiva de metales. Acta Mater. 117, 371–392 (2016).
Artículo ADS CAS Google Académico
Nadammal, N. et al. Papel crítico de las estrategias de escaneo en el desarrollo de la microestructura, la textura y las tensiones residuales durante la fabricación aditiva de fusión de lecho de polvo por láser. Agregar Fabricación 38, 101792 (2021).
CAS Google Académico
Li, Y., Liang, X., Yu, Y., Wang, D. y Lin, F. Revisión sobre la fabricación aditiva de superaleaciones monocristalinas a base de níquel. Mentón. J. Mec. Ing.: Addit. Fabricación Frente. 1, 100019 (2022).
Google Académico
Sanaei, N. & Fatemi, A. Defectos en los metales fabricados con aditivos y su efecto sobre el rendimiento a la fatiga: una revisión del estado del arte. prog. Mate. ciencia 117, 100724 (2021).
Artículo CAS Google Académico
Shao, S., Khonsari, MM, Guo, S., Meng, WJ y Li, N. Descripción general: la fabricación aditiva permitió un diseño acelerado de aleaciones basadas en Ni para mejorar la vida útil a la fatiga. Agregar Fabricación 29, 100779 (2019).
CAS Google Académico
Zhao, L. et al. Revisión de la correlación entre la microestructura y el rendimiento mecánico para la fusión de lecho de polvo láser AlSi10Mg. Agregar Fabricación 56, 102914 (2022).
CAS Google Académico
Molaei, R. et al. Fatiga del Ti-6Al-4V fabricado aditivo, Parte II: La relación entre la microestructura, las propiedades cíclicas del material y el rendimiento del componente. En t. J. Fatiga 132, 105363 (2020).
Artículo CAS Google Académico
Cao, M., Liu, Y. & Dunne, FP Un enfoque de plasticidad cristalina para comprender la respuesta a la fatiga con respecto a los poros en aleaciones de aluminio fabricadas por aditivos. En t. J. Fatiga 161, 106917 (2022).
Artículo CAS Google Académico
Zhan, Z. & Li, H. Predicción de la vida útil a la fatiga basada en el aprendizaje automático con los efectos de los parámetros del proceso de fabricación aditiva para SS 316L impreso. En t. J. Fatiga 142, 105941 (2021).
Artículo CAS Google Académico
Maleki, E. et al. Sobre la eficiencia del aprendizaje automático para la evaluación de la fatiga de AlSi10Mg fabricado aditivamente posprocesado. En t. J. Fatiga 160, 106841 (2022).
Artículo CAS Google Académico
Li, P., Warner, D., Fatemi, A. y Phan, N. Evaluación crítica del rendimiento de fatiga del Ti-6Al-4V fabricado de forma aditiva y perspectiva para futuras investigaciones. En t. J. Fatiga 85, 130–143 (2016).
Artículo CAS Google Académico
Chern, AH et al. Una revisión del comportamiento a la fatiga del Ti-6Al-4V fabricado mediante fabricación aditiva de fusión por haz de electrones. En t. J. Fatiga 119, 173–184 (2019).
Artículo CAS Google Académico
Afkhami, S., Dabiri, M., Piili, H. y Björk, T. Efectos de los parámetros de fabricación y el posprocesamiento mecánico en acero inoxidable 316L procesado por fusión de lecho de polvo láser. Mate. ciencia Ing., A 802, 140660 (2021).
Artículo CAS Google Académico
Lesperance, X., Ilie, P. & Ince, A. Caracterización de fatiga de ciclo muy alto de aleaciones de aluminio AlSi10Mg y AlSi7Mg fabricadas de forma aditiva basada en pruebas de fatiga ultrasónica. Fractura de fatiga. Ing. Mate. Estructura. 44, 876–884 (2021).
Artículo CAS Google Académico
UNESCO. Recomendación de la UNESCO sobre ciencia abierta https://doi.org/10.54677/MNMH8546 (2021).
Woelfle, M., Olliaro, P. y Todd, MH La ciencia abierta es un acelerador de la investigación. Nat. química 3, 745–748 (2011).
Artículo CAS PubMed Google Académico
Kononova, O. et al. Conjunto de datos extraídos de texto de recetas de síntesis de materiales inorgánicos. ciencia Datos 6, 203 (2019).
Artículo PubMed PubMed Central Google Académico
Court, CJ & Cole, JM Base de datos de materiales generados automáticamente de las temperaturas de Curie y Néel a través de la extracción de relación semisupervisada. ciencia Datos 5, 180111 (2018).
Artículo CAS PubMed PubMed Central Google Scholar
Kumar, P., Kabra, S. & Cole, JM Generación automática de bases de datos de límite elástico y tamaño de grano utilizando ChemDataExtractor. ciencia Datos 9, 292 (2022).
Artículo CAS PubMed Central Google Académico
Chen, S. et al. Conjunto de datos de fatiga de aleaciones de alta entropía. ciencia Datos 9, 381 (2022).
Artículo CAS PubMed PubMed Central Google Scholar
Fortunato, S. et al. Ciencia de la ciencia. Ciencia 359, eaao0185 (2018).
Artículo PubMed PubMed Central Google Académico
ISO/ASTM 52900:2015. Fabricación aditiva–Principios generales–Terminología (ISO/ASTM International, 2015).
ASTM F3413–19. Guía para la deposición de energía dirigida por diseño y fabricación aditiva (ASTM International, 2019).
Thompson, SM, Bian, L., Shamsaei, N. y Yadollahi, A. Una descripción general de la deposición directa por láser para la fabricación aditiva; Parte I: Fenómenos de transporte, modelado y diagnóstico. Agregar Fabricación 8, 36–62 (2015).
Google Académico
Gu, DD, Meiners, W., Wissenbach, K. & Poprawe, R. Fabricación aditiva con láser de componentes metálicos: materiales, procesos y mecanismos. En t. Mate. Rev. 57, 133–164 (2012).
Artículo CAS Google Académico
Frazier, WE Fabricación aditiva de metal: una revisión. J.Mater. Ing. Llevar a cabo. 23, 1917-1928 (2014).
Artículo CAS Google Académico
Murr, LE et al. Fabricación de metales mediante fabricación aditiva utilizando tecnologías de fusión por láser y haz de electrones. J.Mater. ciencia Tecnología 28, 1–14 (2012).
Artículo CAS Google Académico
Suwanpreecha, C. & Manonukul, A. Una revisión sobre la fabricación aditiva de metal por extrusión de materiales y cómo se compara con el moldeo por inyección de metal. Metales 12, 429 (2022).
Artículo CAS Google Académico
Liu, Y. et al. RoBERTa: Un enfoque de preentrenamiento BERT sólidamente optimizado. Preimpresión en https://arxiv.org/abs/1907.11692 (2019).
Kim, E. et al. Parámetros de síntesis codificados y aprendidos por máquina de materiales de óxido. ciencia Datos 4, 170127 (2017).
Artículo CAS PubMed PubMed Central Google Scholar
Berchmans, D. & Kumar, S. Reconocimiento óptico de caracteres: una descripción general y una perspectiva. Internacional de 2014 Conf. de Control, Instrumentación, Comun. computar Tecnología, 1361-1365 (2014).
Jensen, Z. et al. Un enfoque de aprendizaje automático para la síntesis de zeolitas habilitado por la extracción automática de datos de literatura. Ciento ACS. ciencia 5, 892–899 (2019).
Artículo CAS PubMed PubMed Central Google Scholar
Zhu, M. & Cole, JM PDFDataExtractor: una herramienta para leer texto científico e interpretar metadatos de la literatura compuesta en formato de documento portátil. J. Chem. información Modelo. 62, 1633–1643 (2022).
Artículo CAS PubMed PubMed Central Google Scholar
Devlin, J., Chang, MW, Lee, K. & Toutanova, K. BERT: Entrenamiento previo de transformadores bidireccionales profundos para la comprensión del lenguaje. Preimpresión en https://arxiv.org/abs/1810.04805 (2018).
Loshchilov, I. y Hutter, F. Regularización de la disminución del peso desacoplada. Preimpresión en https://arxiv.org/abs/1711.05101 (2017).
Mavracic, J., Court, CJ, Isazawa, T., Elliott, SR & Cole, JM ChemDataExtractor 2.0: Ontologías autopobladas para ciencia de materiales. J. Chem. información Modelo. 61, 4280–4289 (2021).
Artículo CAS PubMed Google Académico
Marrón, T. et al. Los modelos de lenguaje son aprendices de pocas oportunidades. Adv. Información neuronal Proceso. sist. 33, 1877–1901 (2020).
Google Académico
Dunn, A. et al. Extracción de información estructurada de textos científicos complejos con modelos de lenguaje grandes ajustados. Preimpresión en https://arxiv.org/abs/2212.05238 (2022).
IA abierta. Informe técnico GPT-4. Preimpresión en https://arxiv.org/abs/2303.08774 (2023).
ASTM E739–10. Práctica estándar para el análisis estadístico de datos de fatiga de tensión-vida (S-N) y deformación-vida (ε-N) lineales o linealizados (ASTM International, 2015).
Zhang, Z. & Xu, Z. Base de datos de fatiga de aleaciones fabricadas de forma aditiva. parte de la higuera https://doi.org/10.6084/m9.figshare.22337629 (2023).
Li, P., Warner, D. y Phan, N. Predicción del rendimiento de fatiga de un componente de Ti-6Al-4V fabricado de forma aditiva a partir del comportamiento del cupón testigo. Agregar Fabricación 35, 101230 (2020).
CAS Google Académico
Gu, D. et al. Fabricación aditiva láser-metal integrada material-estructura-rendimiento. Ciencia 372, eabg1487 (2021).
Artículo CAS PubMed Google Académico
Xu, Z., Liu, A. y Wang, X. Rendimiento de fatiga y comportamiento de propagación de grietas de AlSi10Mg fundido con láser selectivo en direcciones de construcción de 0 °, 15 °, 45 ° y 90 °. Mate. ciencia Ing., A 812, 141141 (2021).
Artículo CAS Google Académico
Murchio, S. et al. Puntales delgados de Ti-6Al-4V fabricados aditivamente mediante fusión de lecho de polvo láser: efecto de la orientación del edificio en la precisión geométrica y las propiedades mecánicas. J. Mec. Comportamiento biomedicina Mate. 119, 104495 (2021).
Artículo CAS PubMed Google Académico
Li, P. et al. Hacia la predicción de diferencias en el rendimiento de fatiga de cupones de Ti-6Al-4V fusionados con lecho de polvo láser de la misma construcción. En t. J. Fatiga 126, 284–296 (2019).
Artículo CAS Google Académico
Levkulich, N. et al. El efecto de los parámetros del proceso sobre la evolución de la tensión residual y la distorsión en la fusión de lecho de polvo láser de Ti-6Al-4V. Agregar Fabricación 28, 475–484 (2019).
CAS Google Académico
Consejo de Investigación de Ingeniería Mecánica (FKM). Directriz FKM: Evaluación de la resistencia analítica de componentes en ingeniería mecánica (VDMA Verlag, 2003).
ES 1993–1–9. Eurocódigo 3: Diseño de Estructuras de Acero – Parte 1–9: Fatiga (Comité Europeo de Normalización, 2005).
ANSI/ASME B106.1 M–1985. Diseño de ejes de transmisión (Sociedad Estadounidense de Ingenieros Mecánicos, 1985).
Leyens, C. & Peters, M. Titanio y aleaciones de titanio: fundamentos y aplicaciones (John Wiley & Sons, 2003).
Paulonis, DF & Schirra, JJ Alloy 718 en Pratt & Whitney: perspectiva histórica y desafíos futuros. Superaleaciones 718, 625, 706 y varios derivados, 13–23 (2001).
Aboulkhair, NT et al. Impresión 3D de aleaciones de aluminio: Fabricación aditiva de aleaciones de aluminio mediante fusión selectiva por láser. prog. Mate. ciencia 106, 100578 (2019).
Artículo CAS Google Académico
Narasimharaju, SR et al. Una revisión exhaustiva sobre la fusión de aceros por lecho de polvo con láser: procesamiento, microestructura, defectos y métodos de control, propiedades mecánicas, desafíos actuales y tendencias futuras. J. Manuf. Proceso. 75, 375–414 (2022).
Artículo Google Académico
Liu, R., Zhang, P., Zhang, Z., Wang, B. y Zhang, Z. Un modelo práctico para el diseño antifatiga eficiente y la selección de materiales metálicos: I. Construcción de modelos y predicción de resistencia a la fatiga. J.Mater. ciencia Tecnología 70, 233–249 (2021).
Artículo Google Académico
Liu, R., Zhang, P., Zhang, Z., Wang, B. y Zhang, Z. Un modelo práctico para el diseño antifatiga eficiente y la selección de materiales metálicos: II. Análisis de parámetros y mejora de la resistencia a la fatiga. J.Mater. ciencia Tecnología 70, 250–267 (2021).
Artículo Google Académico
Tahmasbi, K., Alharthi, F., Webster, G. y Haghshenas, M. Daño dinámico por fatiga dependiente de la frecuencia en metales: una revisión de vanguardia. Fuerzas Mec. 10, 100167 (2023).
Artículo Google Académico
Milne, L., Gorash, Y., Comlekci, T. & MacKenzie, D. Efectos de frecuencia en pruebas de fatiga ultrasónica (UFT) de acero estructural Q355B. Estructura de procedimiento. Integridad 42, 623–630 (2022).
Artículo Google Académico
Hrabe, NW et al. Hallazgos del taller NIST/ASTM sobre comportamiento mecánico de componentes de fabricación aditiva. Serie de fabricación avanzada (NIST AMS), 1–13 (2016).
Nicoletto, G. Comportamiento de fatiga suave y de muesca de Inconel 718 fundido selectivamente con láser con superficies construidas. En t. J. Fatiga 128, 105211 (2019).
Artículo CAS Google Académico
Wang, Z. et al. ULSA: Lenguaje unificado de acciones de síntesis para la representación de protocolos de síntesis inorgánica. Discoteca digital. 163, 313–324 (2022).
Artículo Google Académico
Schijve, J. Fatiga de estructuras y materiales (Springer, 2009).
De Weck, OL Desarrollo y planificación de la tecnología: un enfoque cuantitativo para la gestión de la tecnología (Springer Nature, 2022).
Saltzer, JH El origen de la "licencia MIT". IEEE Ana. hist. computar 42, 94–98 (2020).
Artículo Google Académico
Descargar referencias
Este estudio fue apoyado por la Fundación Nacional de Ciencias Naturales de China a través de las subvenciones 11825203, 11832010, 11921002, 52090032, 12122204 y 11872150.
Universidad de Tsinghua, Laboratorio de Mecánica Aplicada y Departamento de Ingeniería Mecánica, Beijing, 100084, China
Zian Zhang y Zhiping Xu
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
ZX concibió y supervisó la investigación. ZZ realizó el trabajo. Ambos autores participaron en la discusión de los resultados y en la preparación del manuscrito.
Correspondencia a Zhiping Xu.
Los autores declaran no tener conflictos de intereses.
Nota del editor Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.
Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.
Reimpresiones y permisos
Zhang, Z., Xu, Z. Base de datos de fatiga de aleaciones fabricadas de forma aditiva. Datos científicos 10, 249 (2023). https://doi.org/10.1038/s41597-023-02150-x
Descargar cita
Recibido: 04 enero 2023
Aceptado: 12 abril 2023
Publicado: 02 mayo 2023
DOI: https://doi.org/10.1038/s41597-023-02150-x
Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:
Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.
Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt