{rfName}
Th

Indexado en

Citaciones

6

Altmetrics

Investigadores/as Institucionales

Ortiz-Martinez, DAutor (correspondencia)

Compartir

15 de junio de 2024
Publicaciones
>
Artículo
No

The scaling problem in the pattern recognition approach to machine translation

Publicado en: PATTERN RECOGNITION LETTERS. 29 (8): 1145-1153 - 2008-06-01 29(8), DOI: 10.1016/j.patrec.2007.10.001

Autores:

Ortiz-Martinez, D; Garcia-Varea, I; Casacuberta, F
[+]

Afiliaciones

Univ Politecn Valencia, Dept Sistemas Informat & Computacio, Valencia, Spain - Autor o Coautor
Univ Politecn Valencia, Dept Sistemas Informat, Valencia, Spain - Autor o Coautor

Resumen

Statistical machine translation (SMT) has proven to be an interesting pattern recognition framework for automatically building machine translations systems from available parallel corpora. In the last few years, research in SMT has been characterized by two significant advances. First, the popularization of the so called phrase-based statistical translation models, which allows to incorporate local contextual information to the translation models. Second, the availability of larger and larger parallel corpora, which are composed of millions of sentence pairs, and tens of millions of running words. Since phrase-based models basically consists in statistical dictionaries of phrase pairs, their estimation from very large corpora is a very costly task that yields a huge number of parameters which are to be stored in memory. The handling of millions of model parameters and a similar number of training samples have become a bottleneck in the field of SMT, as well as in other well-known pattern recognition tasks such as speech recognition or handwritten recognition, just to name a few. In this paper, we propose a general framework that deals with the scaling problem in SMT without introducing significant time overhead by means of the combination of different scaling techniques. This new framework is based on the use of counts instead of probabilities, and on the concept of cache memory. (C) 2007 Elsevier B.V. All rights reserved.
[+]

Palabras clave

Large-scale pattern recognitionMachine translationPhrase-based translationSearch/decoding algorithmStatistical machine translationStatistical pattern recognition

Indicios de calidad

Impacto bibliométrico. Análisis de la aportación y canal de difusión

El trabajo ha sido publicado en la revista PATTERN RECOGNITION LETTERS debido a la progresión y el buen impacto que ha alcanzado en los últimos años, según la agencia Scopus (SJR), se ha convertido en una referencia en su campo. En el año de publicación del trabajo, 2008, se encontraba en la posición , consiguiendo con ello situarse como revista Q1 (Primer Cuartil), en la categoría Computer Vision and Pattern Recognition. Destacable, igualmente, el hecho de que la Revista está posicionada por encima del Percentil 90.

Independientemente del impacto esperado determinado por el canal de difusión, es importante destacar el impacto real observado de la propia aportación.

Según las diferentes agencias de indexación, el número de citas acumuladas por esta publicación hasta la fecha 2026-04-03:

  • WoS: 3
[+]

Impacto y visibilidad social

Desde la dimensión de Influencia o adopción social, y tomando como base las métricas asociadas a las menciones e interacciones proporcionadas por agencias especializadas en el cálculo de las denominadas “Métricas Alternativas o Sociales”, podemos destacar a fecha 2026-04-03:

  • El uso, desde el ámbito académico evidenciado por el indicador de la agencia Altmetric referido como agregaciones realizadas por el gestor bibliográfico personal Mendeley, nos da un total de: 11.
  • La utilización de esta aportación en marcadores, bifurcaciones de código, añadidos a listas de favoritos para una lectura recurrente, así como visualizaciones generales, indica que alguien está usando la publicación como base de su trabajo actual. Esto puede ser un indicador destacado de futuras citas más formales y académicas. Tal afirmación es avalada por el resultado del indicador “Capture” que arroja un total de: 11 (PlumX).

Con una intencionalidad más de divulgación y orientada a audiencias más generales podemos observar otras puntuaciones más globales como:

  • El Score total de Altmetric: 3.
[+]

Análisis de liderazgo de los autores institucionales

Existe un liderazgo significativo ya que algunos de los autores pertenecientes a la institución aparecen como primer o último firmante, se puede apreciar en el detalle: Primer Autor (Ortiz Martinez, Daniel) .

el autor responsable de establecer las labores de correspondencia ha sido Ortiz Martinez, Daniel.

[+]