Lessons learned from contrasting a BLAS kernel implementations

This work reviews the experience of implementing different versions of the SSPR rank-one update operation of the BLAS library. The main objective was to contrast CPU versus GPU implementation effort and complexity of an optimized BLAS routine, not considering performance. This work contributes with...

Descripción completa

Guardado en:

Detalles Bibliográficos
Autor principal:	More, Andres
Formato:	Objeto de conferencia
Lenguaje:	Inglés
Publicado:	2013
Materias:	Ciencias Informáticas BLAS libraries SSPR kernel CPU architecture GPU architecture performance analysis performance measurement software optimization Software libraries Optimization PROCESSOR ARCHITECTURES Performance Analysis and Design Aids
Acceso en línea:	http://sedici.unlp.edu.ar/handle/10915/31702
Aporte de:	SEDICI (UNLP) de Universidad Nacional de La Plata

Ejemplares similares

A Study of Hardware Performance Counters Selection for Cross Architectural GPU Power Modeling
por: Pi Puig, Martín, et al.
Publicado: (2019)

Evaluación de performance en Redes Definidas por Software para Centro de Datos : Hipótesis de Trabajo
por: Bolatti, Diego, et al.
Publicado: (2016)

An Optimization-based Tool to Support the cost-effective Production of Software Architecture Documentation
por: Nicoletti, Matías, et al.
Publicado: (2016)

Automatic mapping tasks to cores : Evaluating AMTHA Algorithm in multicore architectures
por: De Giusti, Laura Cristina, et al.
Publicado: (2009)

Localización de errores dirigida por la arquitectura en sistemas basados en eventos
por: Soria, Alvaro
Publicado: (2003)

Evaluating tradeoff between recall and perfomance of GPU permutation index
por: Lopresti, Mariela, et al.
Publicado: (2013)

GPU optimization of electroencephalogram analysis
por: Raimondo, Federico, et al.
Publicado: (2011)

WRF-SFIRE: análisis de rendimiento y optimización de recursos en ambientes HPC
por: Schmidt, Rodolfo Alejandro, et al.
Publicado: (2023)

Intel Xeon Phi Coprocessor High Performance Programming : James Jeffers, James Reinders Morgan Kaufmann, 2013 ISBN-13: 978-0124104143
por: More, Andres
Publicado: (2013)

Performance Analysis and Optimizations Techniques for Legacy Code Numerical Simulations
por: Díaz, Federico José, et al.
Publicado: (2020)

Contemporary library architecture : a planning and design guide /
por: Worpole, Ken
Publicado: (2013)

Computación de alto desempeño en GPU : EDULP, 2011. ISBN 978-950-34-0759-2
por: Piccoli, María Fabiana
Publicado: (2012)

Information and documentation - library performance indicators. Information et documentation - indicateurs de performance des bibliothèques. Amendment 1, Indicateurs complementaires de performance des bibliotheques.
Publicado: (2003)

Cálculo en tiempo real de identificadores robustos para objetos multimedia mediante una arquitectura paralela CPU-GPU
por: Miranda, Natalia Carolina
Publicado: (2016)

Towards distributed reasoning for behavioral optimization
por: Cebulla, Michael
Publicado: (2006)

Fundamentos de cómputo paralelo y distribuido de altas prestaciones : Construcción y evaluación de aplicaciones
por: Naiouf, Marcelo, et al.
Publicado: (2014)

Integración de Metodologías Ágiles y Arquitecturas de Software en el desarrollo de Sistemas de Información
por: Navarro, Mirta Elizabeth, et al.
Publicado: (2016)

Brief performance portability analysis of a matrix multiplication kernel on multiple vendor GPUs
por: Costanzo, Manuel, et al.
Publicado: (2023)

At home with books : how booklovers live with and care for their libraries /
por: Ellis, Estelle
Publicado: (1995)

Estudiar espacios, prever sus voces
por: Salzano, Agustín
Publicado: (2021)

Evolution of product line architectures
por: Amaolo, Marcelo Paulo
Publicado: (2003)

A structural computing model for dynamic service-based systems
por: King, Peter, et al.
Publicado: (2004)

Efficiency analysis of a physical problem: different parallel computational approaches for a dynamical integrator evolution
por: Gaudiani, Adriana, et al.
Publicado: (2013)

Improving Workflows Execution on DAGMan by a Perfomance-driven Scheduling Tool
por: Monge, David A., et al.
Publicado: (2010)

Análisis de la robustez del método de asignación MATEHa
por: De Giusti, Laura Cristina, et al.
Publicado: (2007)

Towards the Specification of the GPU using Performance Parameters
por: Perez, Cristian, et al.
Publicado: (2011)

A meshing tool product line architecture
por: Bastarrica, María Cecilia
Publicado: (2006)

From software architecture descriptions to object-oriented designs
por: Rodríguez, Guillermo Horacio, et al.
Publicado: (2014)

Representación y razonamiento sobre las decisiones de diseño de arquitectura de software
por: Carignano, María Celeste
Publicado: (2016)

T�ecniques de representaci�o fotorealista per al disseny de productes : 3ds Max Design /
por: Magal Royo, Teresa
Publicado: (2015)

Planning academic and research library buildings.
por: Leighton, Philip D.
Publicado: (1986)

Implementation of GTS
por: Barrado, C., et al.

Implementation of GTS
Publicado: (1994)

El habitar arquitectónico. La Belleza como vínculo a la Emoción
por: Miraglia, Martín
Publicado: (2015)

Extendiendo transformaciones MDA con metamodelo de patrones de diseño
por: Roqué Fourcade, Luis Ernesto, et al.
Publicado: (2017)

Optimización económica basada en simulación de edificios : Análisis de herramientas disponibles
por: Sulaiman, Halimi Cristina, et al.
Publicado: (2015)

TopoGen: A network topology generation architecture with application to automating simulations of software defined networks
por: Laurito, A., et al.

TopoGen: A network topology generation architecture with application to automating simulations of software defined networks
Publicado: (2018)

Improving the performance of matrix inversion with a Tesla GPU
por: Ezzatti, Pablo, et al.
Publicado: (2010)

Modeling software behavior : a craftsman's approach /
por: Jorgensen, Paul
Publicado: (2009)