{rfName}
Th

Indexat a

Citacions

6

Altmetrics

Anàlisi d'autories institucional

Ortiz-Martinez, DAutor (correspondència)

Compartir

15 dejuny de 2024
Publicacions
>
Article
No

The scaling problem in the pattern recognition approach to machine translation

Publicat a: PATTERN RECOGNITION LETTERS. 29 (8): 1145-1153 - 2008-06-01 29(8), DOI: 10.1016/j.patrec.2007.10.001

Autors:

Ortiz-Martinez, D; Garcia-Varea, I; Casacuberta, F
[+]

Afiliacions

Univ Politecn Valencia, Dept Sistemas Informat & Computacio, Valencia, Spain - Autor o coautor
Univ Politecn Valencia, Dept Sistemas Informat, Valencia, Spain - Autor o coautor

Resum

Statistical machine translation (SMT) has proven to be an interesting pattern recognition framework for automatically building machine translations systems from available parallel corpora. In the last few years, research in SMT has been characterized by two significant advances. First, the popularization of the so called phrase-based statistical translation models, which allows to incorporate local contextual information to the translation models. Second, the availability of larger and larger parallel corpora, which are composed of millions of sentence pairs, and tens of millions of running words. Since phrase-based models basically consists in statistical dictionaries of phrase pairs, their estimation from very large corpora is a very costly task that yields a huge number of parameters which are to be stored in memory. The handling of millions of model parameters and a similar number of training samples have become a bottleneck in the field of SMT, as well as in other well-known pattern recognition tasks such as speech recognition or handwritten recognition, just to name a few. In this paper, we propose a general framework that deals with the scaling problem in SMT without introducing significant time overhead by means of the combination of different scaling techniques. This new framework is based on the use of counts instead of probabilities, and on the concept of cache memory. (C) 2007 Elsevier B.V. All rights reserved.
[+]

Paraules clau

Large-scale pattern recognitionMachine translationPhrase-based translationSearch/decoding algorithmStatistical machine translationStatistical pattern recognition

Indicis de qualitat

Impacte bibliomètric. Anàlisi de la contribució i canal de difusió

El treball ha estat publicat a la revista PATTERN RECOGNITION LETTERS a causa de la seva progressió i el bon impacte que ha aconseguit en els últims anys, segons l'agència Scopus (SJR), s'ha convertit en una referència en el seu camp. A l'any de publicació del treball, 2008, es trobava a la posició , aconseguint així situar-se com a revista Q1 (Primer Cuartil), en la categoria Computer Vision and Pattern Recognition. Destacable, igualment, el fet que la revista està posicionada per sobre del Percentil 90.

Independentment de l'impacte esperat determinat pel canal de difusió, és important destacar l'impacte real observat de la pròpia aportació.

Segons les diferents agències d'indexació, el nombre de citacions acumulades per aquesta publicació fins a la data 2026-04-03:

  • WoS: 3
[+]

Impacte i visibilitat social

Des de la dimensió d'influència o adopció social, i prenent com a base les mètriques associades a les mencions i interaccions proporcionades per agències especialitzades en el càlcul de les denominades "Mètriques Alternatives o Socials", podem destacar a data 2026-04-03:

  • L'ús, des de l'àmbit acadèmic evidenciat per l'indicador de l'agència Altmetric referit com a agregacions realitzades pel gestor bibliogràfic personal Mendeley, ens dona un total de: 11.
  • L'ús d'aquesta aportació en marcadors, bifurcacions de codi, afegits a llistes de favorits per a una lectura recurrent, així com visualitzacions generals, indica que algú està fent servir la publicació com a base del seu treball actual. Això pot ser un indicador destacat de futures cites més formals i acadèmiques. Aquesta afirmació està avalada pel resultat de l'indicador "Capture", que aporta un total de: 11 (PlumX).

Amb una intenció més de divulgació i orientada a audiències més generals, podem observar altres puntuacions més globals com:

  • El Puntuació total de Altmetric: 3.
[+]

Anàlisi del lideratge dels autors institucionals

Hi ha un lideratge significatiu, ja que alguns dels autors pertanyents a la institució apareixen com a primer o últim signant, es pot apreciar en el detall: Primer Autor (Ortiz Martinez, Daniel) .

l'autor responsable d'establir les tasques de correspondència ha estat Ortiz Martinez, Daniel.

[+]