Copyright
Copyright © José
Luis Lara Carrascal 2008-2023 
Sumario
Introducción
Instalación
Configuración
Enlaces
Introducción
Ccache
es un compilador caché que puede llegar a acelerar hasta 10
veces la recompilación (esto implica también una
instalación de versiones futuras del programa cacheado, pero con un mayor tiempo de compilación) de
cualquier programa cuyo código fuente esté escrito en C, C++, Objetive-C y Objetive-C++. La forma de trabajar de Ccache
consiste en detectar si el código que se está compilando
es el mismo que se ha compilado anteriormente. Para ello utiliza el algoritmo de resumen (hash) MD4, para obtener la información en función del modo utilizado por Ccache, que pueden ser los siguientes:
1) Modo direct (el predefinido) : Ccache hashea el código fuente e incluye los archivos de forma directa. El hash contiene la información común y:
* Los archivos de código fuente de entrada.
* Las opciones de línea de comandos.
Resumiendo, si el archivo objeto y la salida del preprocesador no han cambiado, se utiliza este modo.
2) Modo preprocessor (más lento) : Ccache ejecuta el preprocesador en el código fuente y hashea el resultado. El hash contiene la información común y:
* La información de salida del preprocesador cuando el compilador se está ejecutando con la opción -E.
* Las opciones de línea de comandos excepto las que afectan a los archivos incluidos (-I, -include, -D, etc.).
* Toda la información de salida estándar de errores (stderr) generada por el preprocesador.
Resumiendo, si el archivo objeto ha cambiado pero la salida
del preprocesador es la misma, se utiliza este modo, más lento
que el anterior.
3) Modo depend
: Ccache no utiliza nunca el preprocesador funcionando siempre en modo
direct. Esto provoca que la tasa de aciertos sea más baja. Este
modo no es compatible con la opción run_second_cpp=false (export
CCACHE_NOCPP2=true).
En este manual trataremos su instalación desde
código fuente y su configuración para que todos los
procesos de compilación que llevemos a cabo en nuestro sistema
sean cacheados por Ccache.
Instalación
Dependencias
Herramientas de Compilación
Entre paréntesis la
versión con la que se ha compilado Ccache
para la elaboración de este documento.
* GCC - (13.2.0) o Clang - (16.0.6)
* CMake - (3.27.4)
* Ninja - (1.11.1)
Librerías
de Desarrollo
* Hiredis - (1.1.0)
* Libzstd - (1.5.5)
Aplicaciones
* Asciidoctor - (2.0.20) [1]
[1] Requerido para poder generar la documentación del programa, que no se instala con el mismo.
Descarga
ccache-4.8.3.tar.xz
Optimizaciones
$ export
{C,CXX}FLAGS='-O3 -march=znver3 -mtune=znver3'
|
Donde pone znver3 se indica el procesador respectivo de cada sistema seleccionándolo de la siguiente tabla: |
Nota informativa sobre las optimizaciones para GCC
|
* La opción '-march=' establece el procesador mínimo con el que funcionará el programa compilado, la opción '-mtune=' el procesador específico para el que será optimizado.
* Los valores separados por comas, son equivalentes, es decir, que lo mismo da poner '-march=k8' que '-march=athlon64'.
* En versiones de GCC 3.2 e inferiores se utiliza la opción '-mcpu=' en lugar de '-mtune='.
|
Nota informativa sobre las optimizaciones para Clang
|
* La opción '-mtune=' está soportada a partir de la versión 3.4 de Clang.
* Los valores de color azul no son compatibles con Clang.
* Las filas con el fondo de color amarillo son valores exclusivos de Clang y, por lo tanto, no son aplicables con GCC.
|
Valores |
CPU |
Genéricos |
generic |
Produce un código binario
optimizado para la mayor parte de procesadores existentes. Utilizar
este valor si no sabemos el nombre del procesador que tenemos en
nuestro equipo. Este valor sólo es aplicable en la opción
'-mtune=', si utilizamos GCC. Esta opción está disponible a partir de GCC 4.2. |
native |
Produce un código binario
optimizado para el procesador que tengamos en nuestro sistema, siendo
éste detectado utilizando la instrucción cpuid.
Procesadores antiguos pueden no ser detectados utilizando este valor.
Esta opción está disponible a partir de GCC 4.2. |
x86-64 |
Procesador genérico con extensiones 64-bit. Esta opción está disponible a partir de GCC 8 y Clang 1.9. |
x86-64-v2 |
Procesador genérico con con
soporte de instrucciones X86-64 (MMX, SSE, SSE2, LAHFSAHF, POPCNT,
SSE3, SSE4.1, SSE4.2, SSSE3) y extensiones 64-bit. Esta opción
está disponible a partir de GCC 11 y Clang 12. |
x86-64-v3 |
Procesador genérico con con
soporte de instrucciones X86-64 (MMX, SSE, SSE2, LAHFSAHF, POPCNT,
SSE3, SSE4.1, SSE4.2, SSSE3, AVX, AVX2, F16C, FMA, LZCNT, MOVBE, XSAVE,
XSAVEC, FMA4) y extensiones 64-bit. Esta opción está
disponible a partir de GCC 11 y Clang 12. |
x86-64-v4 |
Procesador genérico con con
soporte de instrucciones X86-64 (MMX, SSE, SSE2, LAHFSAHF, POPCNT,
SSE3, SSE4.1, SSE4.2, SSSE3, AVX, AVX2, F16C, FMA, LZCNT, MOVBE, XSAVE,
XSAVEC, AVX512*, FMA4) y extensiones 64-bit. Esta opción
está disponible a partir de GCC 11 y Clang 12. |
Intel |
alderlake |
Intel Alderlake con soporte de
instrucciones x86-64 (MOVBE, MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1,
SSE4.2, POPCNT, PKU, AVX, AVX2, AES, PCLMUL, FSGSBASE, RDRND, FMA, BMI,
BMI2, F16C, RDSEED, ADCX, PREFETCHW, CLFLUSHOPT, XSAVEC, XSAVES,
AVX512F, CLWB, AVX512VL, AVX512BW, AVX512DQ, AVX512CD, AVX512VNNI,
AVX512BF16, MOVDIRI, MOVDIR64B, AVX512VP2INTERSECT, ENQCMD, CLDEMOTE,
PTWRITE, WAITPKG, SERIALIZE, TSXLDTRK, UINTR, AMX-BF16, AMX-TILE,
AMX-INT8, AVX-VNNI) y extensiones 64-bit. Esta opción
está disponible a partir de GCC 11 y Clang 12. |
atom |
Intel Atom con soporte de
instrucciones MMX, SSE, SSE2, SSE3, SSSE3 y extensiones
64-bit. Esta opción está disponible desde GCC 4.6, hasta GCC 4.8. A partir de GCC 4.9 se utiliza la definición bonnell. |
bonnell |
Intel Bonnell con soporte de
instrucciones MOVBE, MMX, SSE, SSE2, SSE3, SSSE3 y extensiones
64-bit. Esta opción está disponible a partir de GCC 4.9. |
broadwell |
Intel Broadwell con soporte de
instrucciones MOVBE, MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2,
POPCNT, AVX, AVX2, AES, PCLMUL, FSGSBASE, RDRND, FMA, BMI, BMI2, F16C,
RDSEED, ADCX, PREFETCHW y extensiones 64-bit. Esta opción
está disponible a partir de GCC 4.9 y Clang 3.6. |
cannonlake |
Intel Cannonlake Server con soporte
de instrucciones MOVBE, MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2,
POPCNT, PKU, AVX, AVX2, AES, PCLMUL, FSGSBASE, RDRND, FMA, BMI, BMI2,
F16C, RDSEED, ADCX, PREFETCHW, CLFLUSHOPT, XSAVEC, XSAVES, AVX512F,
AVX512VL, AVX512BW, AVX512DQ, AVX512CD, AVX512VBMI, AVX512IFMA, SHA,
UMIP y extensiones 64-bit. Esta opción está
disponible a partir de GCC 8 y Clang 3.9. |
cascadelake |
Intel Cascadelake con soporte de
instrucciones MOVBE, MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2,
POPCNT, PKU, AVX, AVX2, AES, PCLMUL, FSGSBASE, RDRND, FMA, BMI, BMI2,
F16C, RDSEED, ADCX, PREFETCHW, CLFLUSHOPT, XSAVEC, XSAVES, AVX512F,
CLWB, AVX512VL, AVX512BW, AVX512DQ, AVX512CD, AVX512VNNI y extensiones
64-bit. Esta opción está disponible a partir de GCC 9 y Clang 8. |
cooperlake |
Intel Cooper
Lake con soporte de instrucciones MOVBE, MMX, SSE, SSE2, SSE3, SSSE3,
SSE4.1, SSE4.2, POPCNT, PKU, AVX, AVX2, AES, PCLMUL, FSGSBASE, RDRND,
FMA, BMI, BMI2, F16C, RDSEED, ADCX, PREFETCHW, CLFLUSHOPT, XSAVEC,
XSAVES, AVX512F, CLWB, AVX512VL, AVX512BW, AVX512DQ, AVX512CD,
AVX512VNNI, AVX512BF16 y extensiones 64-bit. Esta opción
está disponible a partir de GCC 10 y Clang 9. |
core2 |
Intel Core2 con soporte de
instrucciones MMX, SSE, SSE2, SSE3, SSSE3 y extensiones 64-bit. Esta
opción está disponible a partir de GCC 4.3. |
core-avx2 |
Intel Core (Haswell). Esta opción está disponible desde GCC 4.6, hasta GCC 4.8. A partir de GCC 4.9 se utiliza la definición haswell. |
core-avx-i |
Intel Core (ivyBridge)
con soporte de instrucciones MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1,
SSE4.2, AVX, AES, PCLMUL, FSGSBASE, RDRND, F16C y extensiones
64-bit. Esta opción está disponible desde GCC 4.6, hasta GCC 4.8. A partir de GCC 4.9 se utiliza la definición ivybridge. |
corei7 |
Intel Core i7 con soporte
de instrucciones MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1 y SSE4.2 y
extensiones 64-bit. Soporta también los procesadores Intel Core
i3 e i5. Esta opción está disponible desde GCC 4.6, hasta GCC 4.8. A partir de GCC 4.9 se utiliza la definición nehalem. |
corei7-avx |
Intel Core i7 con soporte de
instrucciones MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2, AVX, AES y
PCLMUL y extensiones 64-bit. Soporta también los procesadores
Intel Core i3 e i5. Esta opción está disponible
desde GCC 4.6, hasta GCC 4.8. A partir de GCC 4.9 se utiliza la definición sandybridge. |
emeraldrapids |
Intel Emerald Rapids. Esta opción está disponible a partir de GCC 13 y Clang 16. |
goldmont |
Intel Goldmont con soporte de
instrucciones MOVBE, MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2,
POPCNT, AES, PCLMUL, RDRND, XSAVE, XSAVEOPT, FSGSBASE y extensiones
64-bit. Esta opción está disponible a partir de GCC 9 y Clang 5. |
goldmont-plus |
Intel Goldmont Plus con soporte de
instrucciones MOVBE, MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2,
POPCNT, AES, PCLMUL, RDRND, XSAVE, XSAVEOPT, FSGSBASE, PTWRITE, RDPID,
SGX, UMIP y extensiones 64-bit. Esta opción está
disponible a partir de GCC 9 y Clang 7. |
grandridge |
Intel Grand Ridge con soporte de
instrucciones MOVBE, MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2,
POPCNT, AES, PREFETCHW, PCLMUL, RDRND, XSAVE, XSAVEC, XSAVES, XSAVEOPT,
FSGSBASE, PTWRITE, RDPID, SGX, GFNI-SSE, CLWB, MOVDIRI, MOVDIR64B,
CLDEMOTE, WAITPKG, ADCX, AVX, AVX2, BMI, BMI2, F16C, FMA, LZCNT,
PCONFIG, PKU, VAES, VPCLMULQDQ, SERIALIZE, HRESET, KL, WIDEKL,
AVX-VNNI, AVXIFMA, AVXVNNIINT8, AVXNECONVERT, CMPCCXADD, RAOINT y
extensiones 64-bit. Esta opción está disponible a partir
de GCC 13 y Clang 16. |
graniterapids |
Intel Grand Ridge con soporte de
instrucciones MOVBE, MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2,
POPCNT, CX16, SAHF, FXSR, AVX, XSAVE, PCLMUL, FSGSBASE, RDRND, F16C,
AVX2, BMI, BMI2, LZCNT, FMA, MOVBE, HLE, RDSEED, ADCX, PREFETCHW, AES,
CLFLUSHOPT, XSAVEC, XSAVES, SGX, AVX512F, AVX512VL, AVX512BW, AVX512DQ,
AVX512CD, PKU, AVX512VBMI, AVX512IFMA, SHA, AVX512VNNI, GFNI, VAES,
AVX512VBMI2, VPCLMULQDQ, AVX512BITALG, RDPID, AVX512VPOPCNTDQ, PCONFIG,
WBNOINVD, CLWB, MOVDIRI, MOVDIR64B, AVX512VP2INTERSECT, ENQCMD,
CLDEMOTE, PTWRITE, WAITPKG, SERIALIZE, TSXLDTRK, UINTR, AMX-BF16,
AMX-TILE, AMX-INT8, AVX-VNNI, AVX512-FP16, AVX512BF16, AMX-FP16,
PREFETCHI y extensiones 64-bit. Esta opción está
disponible a partir de GCC 13 y Clang 16. |
haswell |
Intel Haswell con soporte de
instrucciones MOVBE, MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2,
POPCNT, AVX, AVX2, AES, PCLMUL, FSGSBASE, RDRND, FMA, BMI, BMI2, F16C y
extensiones 64-bit. Esta opción está disponible a
partir de GCC 4.9. |
i386 |
Intel i386.
|
i486 |
Intel i486. |
i586, pentium |
Intel Pentium sin soporte de instrucciones MMX. |
i686 |
Produce un código binario
optimizado para la mayor parte de procesadores compatibles con la serie
80686 de Intel. Todos los actuales lo son. |
icelake-client |
Intel Icelake Client con soporte de
instrucciones MOVBE, MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2,
POPCNT, PKU, AVX, AVX2, AES, PCLMUL, FSGSBASE, RDRND, FMA, BMI, BMI2,
F16C, RDSEED, ADCX, PREFETCHW, CLFLUSHOPT, XSAVEC, XSAVES, AVX512F,
AVX512VL, AVX512BW, AVX512DQ, AVX512CD, AVX512VBMI, AVX512IFMA, SHA,
CLWB, UMIP, RDPID, GFNI, AVX512VBMI2, AVX512VPOPCNTDQ, AVX512BITALG,
AVX512VNNI, VPCLMULQDQ, VAES y extensiones 64-bit. Esta
opción está disponible a partir de GCC 8 y Clang 7. |
icelake-server |
Intel Icelake Server con soporte de
instrucciones MOVBE, MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2,
POPCNT, PKU, AVX, AVX2, AES, PCLMUL, FSGSBASE, RDRND, FMA, BMI, BMI2,
F16C, RDSEED, ADCX, PREFETCHW, CLFLUSHOPT, XSAVEC, XSAVES, AVX512F,
AVX512VL, AVX512BW, AVX512DQ, AVX512CD, AVX512VBMI, AVX512IFMA, SHA,
CLWB, UMIP, RDPID, GFNI, AVX512VBMI2, AVX512VPOPCNTDQ, AVX512BITALG,
AVX512VNNI, VPCLMULQDQ, VAES, PCONFIG, WBNOINVD y extensiones
64-bit. Esta opción está disponible a partir de GCC 8 y Clang 7. |
intel |
Intel Haswell y Silvermont. Este
valor sólo es aplicable en la opción '-mtune='. Esta
opción está disponible a partir de GCC 4.9. |
ivybridge |
Intel Ivy Bridge con soporte de
instrucciones MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2, POPCNT, AVX,
AES, PCLMUL, FSGSBASE, RDRND, F16C y extensiones 64-bit. Esta
opción está disponible a partir de GCC 4.9. |
knl |
Intel Knights Landing con soporte de
instrucciones MOVBE, MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2,
POPCNT, AVX, AVX2, AES, PCLMUL, FSGSBASE, RDRND, FMA, BMI, BMI2, F16C,
RDSEED, ADCX, PREFETCHW, AVX512F, AVX512PF, AVX512ER y extensiones
64-bit. Esta opción está disponible a partir de GCC 5 y Clang 3.4. |
knm |
Intel Knights Mill con soporte de
instrucciones MOVBE, MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2,
POPCNT, AVX, AVX2, AES, PCLMUL, FSGSBASE, RDRND, FMA, BMI, BMI2, F16C,
RDSEED, ADCX, PREFETCHW, AVX512F, AVX512PF, AVX512ER, AVX512CD,
AVX5124VNNIW, AVX5124FMAPS, AVX512VPOPCNTDQ y extensiones 64-bit. Esta
opción está disponible a partir de GCC 8 y Clang 6. |
lakemont |
Intel Quark Lakemont MCU, basado en el procesador Intel Pentium. Esta opción está disponible a partir de GCC 6 y Clang 3.9. |
meteorlake |
Intel Meteor Lake. Esta opción está disponible a partir de GCC 13 y Clang 16. |
nehalem |
Intel Nehalem con soporte de
instrucciones MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2, POPCNT y
extensiones 64-bit. Esta opción está disponible a
partir de GCC 4.9. |
nocona |
Versión mejorada de Intel Pentium4 con soporte de instrucciones MMX, SSE, SSE2, SSE3 y extensiones 64-bit. |
penryn |
Intel Penryn con soporte de instrucciones MMX, SSE, SSE2, SSE3, SSSE3 y SSE4.1. |
pentiumpro |
Intel PentiumPro. |
pentium2 |
Intel Pentium2 basado en PentiumPro con soporte de instrucciones MMX. |
pentium3, pentium3m |
Intel Pentium3 basado en PentiumPro con soporte de instrucciones MMX y SSE. |
pentium4, pentium4m |
Intel Pentium4 con soporte de instrucciones MMX, SSE y SSE2. |
pentium-m |
Versión de bajo consumo de
Intel Pentium3 con soporte de instrucciones MMX, SSE y SSE2. Utilizado
por los portátiles Centrino. |
pentium-mmx |
Intel PentiumMMX basado en Pentium con soporte de instrucciones MMX. |
prescott |
Versión mejorada de Intel Pentium4 con soporte de instrucciones MMX, SSE, SSE2 y SSE3. |
raptorlake |
Intel Raptor Lake. Esta opción está disponible a partir de GCC 13 y Clang 16. |
rocketlake |
Intel Rocket Lake con soporte de
instrucciones x86-64 (MOVBE, MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1,
SSE4.2, POPCNT, PKU, AVX, AVX2, AES, PCLMUL, FSGSBASE, RDRND, FMA, BMI,
BMI2, F16C, RDSEED, ADCX, PREFETCHW, CLFLUSHOPT, XSAVEC, XSAVES,
AVX512F, AVX512VL, AVX512BW, AVX512DQ, AVX512CD, AVX512VBMI,
AVX512IFMA, SHA, CLWB, UMIP, RDPID, GFNI, AVX512VBMI2, AVX512VPOPCNTDQ,
AVX512BITALG, AVX512VNNI, VPCLMULQDQ, VAES) y extensiones 64-bit. Esta
opción está disponible a partir de GCC 11 y Clang 13. |
sandybridge |
Intel Sandy Bridge con soporte de
instrucciones MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2, POPCNT, AVX,
AES, PCLMUL y extensiones 64-bit. Esta opción está
disponible a partir de GCC 4.9 y Clang 3.6. |
sapphirerapids |
Intel Sapphire Rapids con soporte
de instrucciones x86-64 (MOVBE, MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1,
SSE4.2, POPCNT, PKU, AVX, AVX2, AES, PCLMUL, FSGSBASE, RDRND, FMA, BMI,
BMI2, F16C, RDSEED, ADCX, PREFETCHW, CLFLUSHOPT, XSAVEC, XSAVES,
AVX512F, CLWB, AVX512VL, AVX512BW, AVX512DQ, AVX512CD, AVX512VNNI,
AVX512BF16, MOVDIRI, MOVDIR64B, AVX512VP2INTERSECT, ENQCMD, CLDEMOTE,
PTWRITE, WAITPKG, SERIALIZE, TSXLDTRK, UINTR, AMX-BF16, AMX-TILE,
AMX-INT8 and AVX-VNNI) y extensiones 64-bit. Esta opción
está disponible a partir de GCC 11 y Clang 12. |
silvermont |
Intel Silvermont con soporte de
instrucciones MOVBE, MMX, SSE, MOVBE, MMX, SSE, SSE2, SSE3, SSSE3,
SSE4.1, SSE4.2, POPCNT, AES, PCLMU, RDRND y extensiones
64-bit. Esta opción está disponible a partir de GCC 4.9 y Clang 3.6. |
sierraforest |
Intel Sierra Forest con soporte de
instrucciones MOVBE, MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2,
POPCNT, AES, PREFETCHW, PCLMUL, RDRND, XSAVE, XSAVEC, XSAVES, XSAVEOPT,
FSGSBASE, PTWRITE, RDPID, SGX, GFNI-SSE, CLWB, MOVDIRI, MOVDIR64B,
CLDEMOTE, WAITPKG, ADCX, AVX, AVX2, BMI, BMI2, F16C, FMA, LZCNT,
PCONFIG, PKU, VAES, VPCLMULQDQ, SERIALIZE, HRESET, KL, WIDEKL,
AVX-VNNI, AVXIFMA, AVXVNNIINT8, AVXNECONVERT, CMPCCXADD y extensiones
64-bit. Esta opción está disponible a partir de GCC 13 y Clang 16. |
skylake |
Intel Skylake con soporte de
instrucciones MOVBE, MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2,
POPCNT, AVX, AVX2, AES, PCLMUL, FSGSBASE, RDRND, FMA, BMI, BMI2, F16C,
RDSEED, ADCX, PREFETCHW, CLFLUSHOPT, XSAVEC, XSAVES y extensiones
64-bit. Esta opción está disponible a partir de GCC 6 y Clang 3.6. |
skylake-avx512 |
Intel Skylake Server con soporte
de instrucciones MOVBE, MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2,
POPCNT, AVX, AVX2, AES, PCLMUL, FSGSBASE, RDRND, FMA, BMI, BMI2, F16C,
RDSEED, ADCX, PREFETCHW, CLFLUSHOPT, XSAVEC, XSAVES, AVX512F, AVX512VL,
AVX512BW, AVX512DQ, AVX512CD y extensiones 64-bit. Esta opción
está disponible a partir de GCC 6 y Clang 3.9. |
tigerlake |
Intel Tiger Lake
con soporte de instrucciones OVBE, MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1,
SSE4.2, POPCNT, PKU, AVX, AVX2, AES, PCLMUL, FSGSBASE, RDRND, FMA, BMI,
BMI2, F16C, RDSEED, ADCX, PREFETCHW, CLFLUSHOPT, XSAVEC, XSAVES,
AVX512F, AVX512VL, AVX512BW, AVX512DQ, AVX512CD, AVX512VBMI,
AVX512IFMA, SHA, CLWB, UMIP, RDPID, GFNI, AVX512VBMI2, AVX512VPOPCNTDQ,
AVX512BITALG, AVX512VNNI, VPCLMULQDQ, VAES, PCONFIG, WBNOINVD, MOVDIRI,
MOVDIR64B, AVX512VP2INTERSECT y extensiones 64-bit. Esta opción
está disponible a partir de GCC 10 y Clang 10. |
tremont |
Intel Tremont con soporte de
instrucciones MOVBE, MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2,
POPCNT, AES, PCLMUL, RDRND, XSAVE, XSAVEOPT, FSGSBASE, PTWRITE, RDPID,
SGX, UMIP, GFNI-SSE, CLWB, ENCLV y extensiones 64-bit. Esta
opción está disponible a partir de GCC 9 y Clang 7. |
westmere |
Intel Westmere con soporte de
instrucciones MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2, POPCNT, AES,
PCLMUL y extensiones 64-bit. Esta opción está
disponible a partir de GCC 4.9. |
yonah |
Procesadores basados en la microarquitectura de Pentium M, con soporte de instrucciones MMX, SSE, SSE2 y SSE3. |
AMD |
amdfam10, barcelona |
Procesadores basados en AMD Family
10h core con soporte de instrucciones x86-64 (MMX, SSE, SSE2, SSE3,
SSE4A, 3DNow!, enhanced 3DNow!, ABM y extensiones 64-bit). Esta
opción está disponible a partir de GCC 4.3. La definición barcelona está disponible a partir de Clang 3.6. |
athlon, athlon-tbird |
AMD Athlon con soporte de instrucciones MMX, 3DNow!, enhanced 3DNow! y SSE prefetch. |
athlon4, athlon-xp, athlon-mp |
Versiones mejoradas de AMD Athlon con soporte de instrucciones MMX, 3DNow!, enhanced 3DNow! y full SSE. |
bdver1 |
Procesadores basados en AMD Family
15h core con soporte de instrucciones x86-64 (FMA4, AVX, XOP, LWP, AES,
PCL_MUL, CX16, MMX, SSE, SSE2, SSE3, SSE4A, SSSE3, SSE4.1, SSE4.2, ABM
y extensiones 64-bit). Esta opción está disponible a
partir de GCC 4.7. |
bdver2 |
Procesadores basados en AMD Family
15h core con soporte de instrucciones x86-64 (BMI, TBM, F16C, FMA, LWP,
AVX, XOP, LWP, AES, PCL_MUL, CX16, MMX, SSE, SSE2, SSE3, SSE4A, SSSE3,
SSE4.1, SSE4.2, ABM y extensiones 64-bit). Esta opción
está disponible a partir de GCC 4.7. |
bdver3 |
Procesadores basados en AMD Family
15h core con soporte de instrucciones x86-64 (FMA4, AVX, XOP, LWP, AES,
PCL_MUL, CX16, MMX, SSE, SSE2, SSE3, SSE4A, SSSE3, SSE4.1, SSE4.2, ABM
y extensiones 64-bit). Esta opción está disponible a
partir de GCC 4.8 y Clang 3.4. |
bdver4 |
Procesadores basados en AMD Family
15h core con soporte de instrucciones x86-64 (BMI, BMI2, TBM, F16C,
FMA, FMA4, FSGSBASE, AVX, AVX2, XOP, LWP, AES, PCL_MUL, CX16, MOVBE,
MMX, SSE, SSE2, SSE3, SSE4A, SSSE3, SSE4.1, SSE4.2, ABM y extensiones
64-bit). Esta opción está disponible a partir de GCC 4.9 y Clang 3.5. |
btver1 |
Procesadores basados en AMD Family
14h core con soporte de instrucciones x86-64 (MMX, SSE, SSE2, SSE3,
SSE4A, CX16, ABM y extensiones 64-bit). Esta opción
está disponible a partir de GCC 4.6. |
btver2 |
Procesadores basados en AMD Family
16h core con soporte de instrucciones x86-64 (MOVBE, F16C, BMI, AVX,
PCL_MUL, AES, SSE4.2, SSE4.1, CX16, ABM, SSE4A, SSSE3, SSE3, SSE2, SSE,
MMX y extensiones 64-bit). Esta opción está
disponible a partir de GCC 4.8. |
geode |
AMD integrado con soporte de instrucciones MMX y 3DNow!. Esta opción está disponible a partir de GCC 4.3. |
k6 |
AMD K6 con soporte de instrucciones MMX. |
k6-2, k6-3 |
Versiones mejoradas de AMD K6 con soporte de instrucciones MMX y 3DNow!. |
k8, opteron, athlon64, athlon-fx |
Procesadores basados en AMD K8 core
con soporte de instrucciones x86-64 (MMX, SSE, SSE2, 3DNow!, enhanced
3DNow! y extensiones 64-bit). |
k8-sse3, opteron-sse3, athlon64-sse3 |
Versiones mejoradas de AMD K8 core
con soporte de instrucciones SSE3. Esta opción está
disponible a partir de GCC 4.3. |
znver1 |
Procesadores basados en AMD Family
17h core con soporte de instrucciones x86-64 (BMI, BMI2, F16C, FMA,
FSGSBASE, AVX, AVX2, ADCX, RDSEED, MWAITX, SHA, CLZERO, AES, PCL_MUL,
CX16, MOVBE, MMX, SSE, SSE2, SSE3, SSE4A, SSSE3, SSE4.1, SSE4.2, ABM,
XSAVEC, XSAVES, CLFLUSHOPT, POPCNT y extensiones 64-bit). Esta
opción está disponible a partir de GCC 6 y Clang 4. |
znver2 |
Procesadores basados en AMD Family
17h core con soporte de instrucciones x86-64 (BMI, BMI2, ,CLWB, F16C,
FMA, FSGSBASE, AVX, AVX2, ADCX, RDSEED, MWAITX, SHA, CLZERO, AES,
PCL_MUL, CX16, MOVBE, MMX, SSE, SSE2, SSE3, SSE4A, SSSE3, SSE4.1,
SSE4.2, ABM, XSAVEC, XSAVES, CLFLUSHOPT, POPCNT y extensiones
64-bit). Esta opción está disponible a partir de GCC 9 y Clang 9. |
znver3 |
Procesadores basados en AMD Family
19h core con soporte de instrucciones x86-64 (BMI, BMI2, CLWB, F16C,
FMA, FSGSBASE, AVX, AVX2, ADCX, RDSEED, MWAITX, SHA, CLZERO, AES,
PCLMUL, CX16, MOVBE, MMX, SSE, SSE2, SSE3, SSE4A, SSSE3, SSE4.1,
SSE4.2, ABM, XSAVEC, XSAVES, CLFLUSHOPT, POPCNT, RDPID, WBNOINVD, PKU,
VPCLMULQDQ, VAES) y extensiones 64-bit. Esta opción
está disponible a partir de GCC 11 y Clang 12. |
znver4 |
Procesadores basados en AMD Family
19h core con soporte de instrucciones x86-64 (BMI, BMI2, CLWB, F16C,
FMA, FSGSBASE, AVX, AVX2, ADCX, RDSEED, MWAITX, SHA, CLZERO, AES,
PCLMUL, CX16, MOVBE, MMX, SSE, SSE2, SSE3, SSE4A, SSSE3, SSE4.1,
SSE4.2, ABM, XSAVEC, XSAVES, CLFLUSHOPT, POPCNT, RDPID, WBNOINVD, PKU,
VPCLMULQDQ, VAES, AVX512F, AVX512DQ, AVX512IFMA, AVX512CD, AVX512BW,
AVX512VL, AVX512BF16, AVX512VBMI, AVX512VBMI2, AVX512VNNI,
AVX512BITALG, AVX512VPOPCNTDQ, GFNI) y extensiones 64-bit. Esta
opción está disponible a partir de GCC 12.3 y Clang 16. |
Optimizaciones adicionales
Optimizaciones adicionales |
GCC |
Graphite
|
$ export {C,CXX}FLAGS+=' -ftree-loop-linear -floop-strip-mine -floop-block' |
IPA
|
$ export {C,CXX}FLAGS+=' -fipa-pta'
|
LTO |
$ export AR=gcc-ar RANLIB=gcc-ranlib NM=gcc-nm
$ export {C,CXX}FLAGS+=' -fuse-linker-plugin -flto=auto'
|
En versiones inferiores a GCC
10, sustituir auto
por el número de núcleos que tenga nuestro
procesador. Si sólo tiene uno, utilizar el parámetro -flto
|
Clang |
Polly |
$ export {C,CXX}FLAGS+=' -O3 -mllvm -polly -mllvm -polly-vectorizer=stripmine' |
LTO |
$ export AR=llvm-ar RANLIB=llvm-ranlib NM=llvm-nm
$ export {C,CXX,LD}FLAGS+=' -flto' |
ThinLTO |
$ export AR=llvm-ar RANLIB=llvm-ranlib NM=llvm-nm
$ export {C,CXX,LD}FLAGS+=' -flto=thin' |
La aplicación de esta optimización es alternativa
a la tradicional LTO, a partir de Clang 3.9 y, por lo tanto, no es combinable con la misma. |
Parámetros adicionales
Parámetros adicionales de eliminación de avisos en el proceso de compilación |
$ export {C,CXX}FLAGS+=' -w' |
Establecer la ruta de búsqueda de directorios de librerías en sistemas de 64 bits multiarquitectura |
$ export
LDFLAGS+=" -L/usr/lib64 -L/usr/local/lib64 -L/opt/gcc13/lib64" |
Cada usuario tendrá
que establecer la ruta de búsqueda de directorios, en
función de la distribución que utilice. |
Establecer el uso de enlazador dinámico para Mold |
$ export LDFLAGS+=' -fuse-ld=mold' |
Establecer el uso de enlazador dinámico para LLD |
Clang |
$ export LDFLAGS+=' -fuse-ld=lld' |
Optimizaciones complementarias LTO/ThinLTO de LLD |
$ export LDFLAGS+=' -Wl,--lto-aa-pipeline=globals-aa -Wl,--lto-newpm-passes=memcpyopt' |
Optimizaciones complementarias LTO de LLD |
$ export LDFLAGS+=" -Wl,--lto-partitions=$(nproc)" |
Optimizaciones complementarias ThinLTO de LLD |
$ export LDFLAGS+=" -Wl,--thinlto-jobs=$(nproc)" |
Establecer la variable de entorno de uso de compilador para Clang |
$ export CC=clang CXX=clang++ |
Extracción y Configuración 
$ tar Jxvf ccache-4.8.3.tar.xz
$ cd ccache-4.8.3
$ mkdir build; cd build
$ cmake -DCMAKE_INSTALL_PREFIX=/usr -DENABLE_TESTING=OFF \
-DCMAKE_AR=$(which $AR) -DCMAKE_RANLIB=$(which $RANLIB) \
-DCMAKE_NM=$(which $NM) -G Ninja ../ |
Explicación de los
comandos
-DCMAKE_INSTALL_PREFIX=/usr
: Instala el programa en el directorio principal, /usr.
-DENABLE_TESTING=OFF : Desactiva la compilación de los tests que contiene el paquete.
-DCMAKE_AR=$(which $AR) -DCMAKE_RANLIB=$(which $RANLIB) -DCMAKE_NM=$(which $NM) : Sincroniza las variables de entorno establecidas en el manual, relativas a los binarios ejecutables intermedios, gcc-ar, gcc-ranlib y gcc-nm, con los parámetros de configuración utilizados por CMake, relativos a los programas ar, ranlib y nm, para poder aplicar correctamente la optimización LTO. Se utiliza el comando which para buscar los ejecutables porque desde
hace ya varias versiones, CMake no establece correctamente la ruta al
ejecutable en cuestión. Esto no es necesario hacerlo, si compilamos el paquete con Clang.
-G Ninja : Utiliza Ninja en lugar de GNU Make para compilar el paquete (opcional).
Compilación
Parámetros de compilación opcionales
-v : Muestra más información en el proceso de compilación.
-j$(nproc) :
Establece el número de procesos de compilación en
paralelo, en función del número de
núcleos e hilos que tenga nuestro procesador, tomando como
referencia la información mostrada por el sistema con el comando
correspondiente. Si nuestro procesador es mononúcleo de un solo
hilo, no añadir esta opción.
Instalación
como root
$ su
# ninja install/strip
# for i in gcc g++ cc c++ clang clang++; do \
ln -s /usr/bin/ccache /bin/$i ; \
done
|
Con la creación de los enlaces simbólicos lo que hacemos es que Ccache gestione todas las compilaciones que vayamos a realizar en nuestro sistema, utilizamos el directorio /bin, porque éste siempre aparece por delante del directorio /usr/bin en la configuración del PATH en los sistemas GNU/Linux, directorio éste último, que es el habitual de ubicación de los ejecutables de la versión de GCC que tengamos en nuestro sistema.
Para comprobar que estamos utilizando estos enlaces simbólicos, nada mejor que utilizar el programa which, que se encarga de buscar el binario que le indiquemos previamente. Por último recordar que la ejecución de Ccache
es completamente transparente en los procesos de compilación, es
decir, no vamos a notar que se está ejecutando cuando compilemos
un programa, la única manera de saberlo es comprobar con
cualquier administrador de archivos que el directorio de la
caché, tiene actividad.
[jose@localhost ~]$ which gcc
/bin/gcc |
En el caso de uso de Clang, basta establecer la correspondiente
variable de entorno, al igual que hicieramos si no tuvieramos instalado
Ccache.
$ export CC=clang CXX=clang++ |
En muchas distribuciones, el directorio /bin es un simple enlace simbólico al directorio /usr/bin.
En este caso, el ejemplo anterior no nos serviría y
tendríamos que utilizar un directorio específico que
colocaríamos siempre por delante del directorio que contenga los
ejecutables o enlaces simbólicos utilizados por el compilador de
turno. Lo más fácil sería utilizar /usr/local/bin
y crearnos un alias de Bash para poder activarlo cuando lo consideremos
oportuno. Un ejemplo que podemos añadir a ~/.bashrc:
alias ccache_on="export PATH=/usr/local/bin:$PATH"
|
Cada vez que escribamos en la consola el comando ccache_on,
el directorio de ubicación de los enlaces simbólicos a
Ccache quedará por delante del resto de directorios configurados
en el PATH.
Otra solución es utilizar directamente Ccache sin enlaces
simbólicos alguno, estableciendo las correspondientes variables
de entorno de uso de compilador, antes de configurar un determinado
paquete.
GCC
$ export CC="ccache gcc" CXX="ccache g++" |
Clang
$ export CC="ccache clang" CXX="ccache clang++" |
Este método da problemas con CMake 3.27 (no en todos los
paquetes) y parece ser que, en las compilaciones de módulos de
Python también. Digo parece ser, porque en mi caso personal,
todo lo relacionado con Python se compila con GCC.
Estadísticas de Compilación e Instalación de Ccache
Estadísticas de Compilación e Instalación de Ccache |
CPU |
AMD Ryzen 5 5500 |
MHz |
3593.250 (BoostMax=4457.000) |
RAM |
32 GB |
Sistema de archivos |
XFS |
Versión del Kernel |
6.5.0-ml SMP PREEMPT_DYNAMIC x86_64 |
Modo de frecuencia de la CPU |
powersave (balance performance) |
Versión de Glibc |
2.38 |
Enlazador dinámico |
LLD 16.0.6 |
Compilador |
Clang 16.0.6 |
Parámetros de optimización |
-03 -march=znver3
-mtune=znver3 -mllvm -polly -mllvm
-polly-vectorizer=stripmine -flto=thin -Wl,--lto-aa-pipeline=globals-aa -Wl,--lto-newpm-passes=memcpyopt |
Parámetros de compilación |
-v -j12 |
Tiempo de compilación |
14" |
Archivos instalados |
2 |

|
Enlaces simbólicos creados |
6 |

|
Ocupación de espacio en disco |
1,2 MB |
Desinstalación
como root
1) MODO TRADICIONAL
Este programa no tiene soporte para desinstalación con el comando 'ninja uninstall'
2) MODO MANUALINUX
El principal inconveniente del comando anterior es
que
tenemos que tener el directorio de compilación en nuestro
sistema para poder desinstalar el programa. En algunos casos esto
supone muchos megas de espacio en disco. Con el paquete de scripts que
pongo a continuación logramos evitar
el único inconveniente que tiene la compilación
de
programas, y es el tema de la desinstalación de los mismos
sin
la necesidad de tener obligatoriamente una copia de las fuentes
compiladas.
ccache-4.8.3-scripts.tar.gz
$ su
# tar zxvf ccache-4.8.3-scripts.tar.gz
# cd ccache-4.8.3-scripts
# ./Desinstalar_ccache-4.8.3 |
Copia de Seguridad
como root
Con este otro script creamos una copia de seguridad de los binarios
compilados, recreando la estructura de directorios de los mismos en un
directorio de copias de seguridad (copibin)
que se crea en el directorio /var. Cuando se haya creado el paquete comprimido de
los binarios podemos copiarlo como usuario a nuestro home
y borrar el que ha creado el script de respaldo, teniendo en cuenta que si queremos
volver a restaurar la copia, tendremos que volver a copiarlo al lugar
donde se ha creado.
$ su
# tar zxvf ccache-4.8.3-scripts.tar.gz
# cd ccache-4.8.3-scripts
# ./Respaldar_ccache-4.8.3 |
Restaurar la Copia de Seguridad
como root
Y con este otro script (que se copia de forma automática cuando
creamos la copia de respaldo del programa) restauramos la copia de
seguridad como root cuando resulte necesario.
$ su
# cd /var/copibin/restaurar_copias
# ./Restaurar_ccache-4.8.3
|
Configuración de Ccache
1) El directorio por defecto de ubicación de la caché
2) Establecer un directorio único de caché para todos los usuarios
3) Limpiar la caché
4) Estadísticas de uso
5) Uso de otras versiones de GCC con Ccache
6) Desactivar el uso de Ccache
7) Volver a almacenar una compilación determinada
8) Hacer que Ccache almacene las cabeceras precompiladas (PCH)
9) Cambiar la ubicación de los archivos temporales de Ccache en sistemas con Tmpfs montado en /tmp
10) Acelerar ligeramente el uso de Ccache modificando el funcionamiento del preprocesador
11) Desactivar la compresión de la caché de Ccache
12) Mostrar las opciones en curso de Ccache
13) Soporte de enlaces de referencia (reflinks) en sistemas de archivos como XFS y BTRFS
14) Activar el almacenamiento en caché de hashes de archivo según el dispositivo, el inodo y las marcas de tiempo
15) Reducir el nivel de compresión de la caché de Ccache
1) El directorio por defecto de ubicación de la caché
A partir de la versión 4.0 de Ccache, la ubicación
predefinida del directorio de la caché se ha modificado. Por
defecto es la siguiente:
Y la ubicación del archivo de configuración es la siguiente:
~/.config/ccache/ccache.conf
|
Tanto en nuestro directorio personal, como en el directorio del
root, el tamaño máximo definido por defecto de la
caché es de 5 GB, tamaño que podemos modificar desde la
línea de comandos, con el siguiente comando, un ejemplo
estableciéndola en 500 MB.
[jose@localhost ~]$ ccache -M 500M
Set cache size limit to 512000k
|
También podemos utilizar G (para GB) y K (para KB), otro ejemplo, esta vez la pongo en 2 GB.
[jose@localhost ~]$ ccache -M 2G
Set cache size limit to 2097152k
|
2) Establecer un directorio único de caché para todos los usuarios
La única condición que debe de tener este directorio es
que sea accesible para lectura y escritura por todos los usuarios. La
ventaja mayor es que nos ahorramos una duplicación de
directorios, el del root y el nuestro propio. Lo primero que debemos de
hacer es crear el directorio con los permisos correspondiente de acceso
y escritura.
$ su -c "install -dm777 /.ccache"
|
Luego, movemos como usuario, el contenido de la caché ubicada en nuestro directorio personal, al nuevo directorio.
$ mv ~/.ccache/* /.ccache
|
La que tengamos en el directorio del root, que siempre será de menor tamaño, simplemente la borramos.
Posteriormente, abrimos un editor de texto y añadimos lo siguiente:
#!/bin/sh
export CCACHE_DIR=/.ccache
export CCACHE_UMASK=000 |
Lo guardamos con el nombre ccache.sh, y lo instalamos en /etc/profile.d.
$ su -c "install -m755 ccache.sh /etc/profile.d"
|
Tenemos que cerrar el emulador de terminal y volverlo a abrir para que
la variable de entorno aplicada sea efectiva. La ventaja de utilizar el directorio /etc/profile.d es que es común a todas las distribuciones y nos evita tener que editar otros archivos del sistema como por ejemplo, /etc/profile.
Mi recomendación personal es utilizar un directorio en otro
disco duro y, a ser posible, en una partición XFS o EXT4, dado el
mínimo nivel de fragmentación que poseen estos sistemas de
archivos. Un tamaño de 15 o 20 GB no es nada descabellado, si
tenemos pensado utilizar Ccache
por defecto para compilar todos los paquetes de código fuente.
3) Limpiar la caché
Para ajustar el tamaño de la caché al máximo
establecido en su configuración, ejecutamos el siguiente
comando, aunque esto no es necesario hacerlo ya que el programa lo hace
de forma automática.
Para borrarla por completo, el siguiente:
La caché de versiones anteriores a la 4.0, de Ccache, no es compatible
con ésta. Tendremos que ejecutar el siguiente comando para borrar tanto
la caché como las estadísticas de uso de la misma.
4) Estadísticas de uso
Como cualquier aplicación caché que se precie, Ccache
también nos muestra estadísticas de uso, con el siguiente
comando (comando que se ha modificado a partir de la versión 4.4
del programa):
4a) Muestra las estadísticas de forma reducida:
[jose@localhost ~]$ ccache -s
Cacheable calls: 483183 / 858219 (56.30%)
Hits: 346826 / 483183 (71.78%)
Direct: 237696 / 346826 (68.53%)
Preprocessed: 109130 / 346826 (31.47%)
Misses: 136357 / 483183 (28.22%)
Uncacheable calls: 375025 / 858219 (43.70%)
Errors: 11 / 858219 ( 0.00%)
Local storage:
Cache size (GB): 10.86 / 30.00 (36.20%)
Cleanups: 1
|
4b) Muestra más información en las estadísticas de uso del programa
[jose@localhost ~]$ ccache -sv
Cache
directory:
/mnt/cache/.ccache
Config
file:
/mnt/cache/.ccache/ccache.conf
System config
file:
/etc/ccache.conf
Stats
updated:
Fri Oct 21 17:54:14 2022
Cacheable
calls:
483183 / 858219 (56.30%)
Hits:
346826 / 483183 (71.78%)
Direct:
237696 / 346826 (68.53%)
Preprocessed:
109130 / 346826 (31.47%)
Misses:
136357 / 483183 (28.22%)
Uncacheable
calls:
375025 / 858219 (43.70%)
Autoconf
compile/link:
63110 / 375025 (16.83%)
Bad compiler
arguments:
7649 / 375025 ( 2.04%)
Called for
linking:
114673 / 375025 (30.58%)
Called for preprocessing: 56364 / 375025 (15.03%)
Compilation
failed:
16441 / 375025 ( 4.38%)
Compiler produced empty output: 5428 / 375025 ( 1.45%)
Compiler produced no output: 9 / 375025 ( 0.00%)
Could not use precompiled header: 408 / 375025 ( 0.11%)
Forced
recache:
56730 / 375025 (15.13%)
Multiple source
files:
147 / 375025 ( 0.04%)
No input
file:
32505 / 375025 ( 8.67%)
Output to
stdout:
145 / 375025 ( 0.04%)
Preprocessing
failed:
13225 / 375025 ( 3.53%)
Unsupported code directive: 172 / 375025 ( 0.05%)
Unsupported compiler option: 7950 / 375025 ( 2.12%)
Unsupported source language: 69 / 375025 ( 0.02%)
Errors:
11 / 858219 ( 0.00%)
Internal
error:
11 / 11 (100.0%)
Successful lookups:
Direct:
237696 / 516035 (46.06%)
Preprocessed:
109130 / 324106 (33.67%)
Local storage:
Cache size
(GB):
10.86 / 30.00 (36.20%)
Files:
318655
Cleanups:
1
Hits:
0
Misses:
0
Reads:
1078911
Writes:
0
|
Para poner a cero las estadísticas, ejecutamos el siguiente
comando:
5) Uso de otras versiones de GCC con Ccache
Además de leernos el correspondiente manual acerca de la instalación de otras versiones de GCC en nuestro sistema, la forma de hacer funcionar Ccache con otras versiones de GCC es muy simple, ejecutando la correspodiente variable de entorno, un ejemplo:
$ export CCACHE_COMPILER=gcc34 |
Ahora ejecutamos gcc --version y comprobamos que nos sale la
versión que le hemos pasado mediante la variable de entorno
anteriormente ejecutada.
[jose@localhost ~]$ gcc --version
gcc34 (GCC) 3.4.6
Copyright (C) 2006 Free Software Foundation, Inc.
Esto es software libre; vea el código para las condiciones de copia. NO hay
garantía; ni siquiera para MERCANTIBILIDAD o IDONEIDAD PARA UN PROPÓSITO EN
PARTICULAR |
Tener en cuenta que el nombre del ejecutable del compilador (en este caso gcc34)
no aparecerá nunca en los mensajes que se muestren en el proceso
de compilación, ya que estamos utilizando como puente a Ccache y los pertinentes enlaces simbólicos que hemos creado.
6) Desactivar el uso de Ccache
Esto es útil si por ejemplo, queremos saber el tiempo real
de compilación de un paquete determinado. Con la siguiente
variable de entorno, Ccache actuará como un simple intermediario sin almacenar dato alguno del proceso de compilación en curso.
$ export
CCACHE_DISABLE=true |
7) Volver a almacenar una compilación determinada
La siguiente variable de entorno es similar a la anterior, en lo que
respecta al tiempo real de compilación. La diferencia radica
en que en este caso, sí se almacenan los datos del proceso de
compilación en curso, empezando desde cero, y sobreescribiendo
los que hubiera en la caché relativos al paquete en
cuestión.
$ export
CCACHE_RECACHE=true |
8) Hacer que Ccache almacene las cabeceras precompiladas (PCH)
Cuando utilizamos Ccache por primera vez, comprobaremos en las estadísticas del mismo que aparece una sección denominada
can't use precompiled header
que se va llenando a medida que vamos compilando paquetes. Para evitar
esto y hacer que este tipo de cabecera que se genera en algunos
procesos de compilación sea también almacenada por Ccache, ejecutamos el siguiente comando de modificación de la configuración de Ccache en la ventana de terminal:
$ ccache -o sloppiness=time_macros,pch_defines |
Que tendremos que combinar con un parámetro de
compilación que le pasaremos a cualquiera de los dos
compiladores que usemos, GCC o Clang:
$ export {C,CXX}FLAGS+=' -fpch-preprocess' |
Reseñar también que el almacenamiento de las cabeceras
precompiladas hace que la caché se llene mucho antes, dado el
tamaño de algunos de estos archivos.
9) Cambiar la ubicación de los archivos temporales de Ccache en sistemas con Tmpfs montado en /tmp
En sistemas que utilicen el sistema de archivos, Tmpfs para ubicar los archivos temporales en /tmp,
es recomendable que los archivos temporales creados por Ccache se
almacenen en este directorio, y no, en el directorio de
ubicación de la caché. La escritura de los archivos
temporales en la memoria física del sistema siempre será
más rápida que la escritura en un disco duro, por muy
rápido que sea éste.
Para modificar esto, editamos el archivo que hemos creado anteriormente, ccache.sh y añadimos lo siguiente, lo que está en rojo:
#!/bin/sh
export CCACHE_DIR=/.ccache
export CCACHE_UMASK=000
export CCACHE_TEMPDIR=/tmp |
10) Acelerar ligeramente el uso de Ccache modificando el funcionamiento del preprocesador
El uso de esta opción hace que Ccache ejecute en primer lugar el
preprocesador, para posteriormente ejecutar el compilador sobre el
código fuente preprocesado, no sobre el original. En
teoría esto hace la compilación más rápida,
al preprocesar el código fuente sólo una vez. Si queremos
hacer uso de esta opción, basta con ejecutar la siguiente
variable de entorno antes de compilar un paquete:
$ export CCACHE_NOCPP2=true |
Si lo queremos hacer fijo, editamos el archivo que hemos creado anteriormente, ccache.sh y añadimos lo siguiente, lo que está en rojo:
#!/bin/sh
export CCACHE_DIR=/.ccache
export CCACHE_UMASK=000
export CCACHE_TEMPDIR=/tmp
export CCACHE_NOCPP2=true |
Esta opción da problemas en la compilación de paquetes como Blender, con lo que, personalmente, no recomiendo su uso.
11) Desactivar la compresión de la caché de Ccache
A partir de la versión 4.0 de Ccache, la compresión de la
caché viene activada por defecto, utilizando Zstandard
como algoritmo de compresión. Si nuestro procesador no es muy
potente, lo más recomendable es desactivarla, aunque el nivel
predefinido de compresión utilizado por el programa es
relativamente bajo (1 de zstd). Para desactivarla, editamos el
archivo que hemos creado
anteriormente, ccache.sh y añadimos lo siguiente, lo que está en rojo:
#!/bin/sh
export CCACHE_DIR=/.ccache
export CCACHE_UMASK=000
export CCACHE_TEMPDIR=/tmp
export CCACHE_NOCPP2=true
export CCACHE_NOCOMPRESS=true |
Si queremos ver las estadísticas de compresión de la caché, ejecutamos ccache -x en la línea de comandos.
[jose@localhost ~]$ ccache -x
Scanning... 100.0% [===============================================================================]
Total data: 4.1 GB (4.3 GB disk blocks)
Compressed data: 4.1 GB (36.7% of original size)
- Original data: 11.3 GB
- Compression ratio: 2.726 x (63.3% space savings)
Incompressible data: 0.0 kB |
12) Mostrar las opciones en curso de Ccache
En cualquier momento, ejecutando el siguiente comando, podemos saber
las opciones de Ccache que se están utilizando. Las opciones
establecidas mediante variable de entorno, podemos hacerlas fijas,
editando el archivo ccache.conf que se encuentra en la raíz del directorio de ubicación que hayamos establecido para Ccache. Un ejemplo:
[jose@localhost ~]$ ccache -p
(default) absolute_paths_in_stderr = false
(default) base_dir =
(environment) cache_dir = /mnt/cache/.ccache
(default) compiler =
(default) compiler_check = mtime
(default) compiler_type = auto
(default) compression = true
(environment) compression_level = -5
(default) cpp_extension =
(default) debug = false
(default) debug_dir =
(default) depend_mode = false
(default) direct_mode = true
(default) disable = false
(default) extra_files_to_hash =
(default) file_clone = false
(default) hard_link = false
(default) hash_dir = true
(default) ignore_headers_in_manifest =
(default) ignore_options =
(default) inode_cache = true
(default) keep_comments_cpp = false
(default) limit_multiple = 0.8
(default) log_file =
(default) max_files = 0
(/mnt/cache/.ccache/ccache.conf) max_size = 30.0G
(default) msvc_dep_prefix = Note: including file:
(default) namespace =
(default) path =
(default) pch_external_checksum = false
(default) prefix_command =
(default) prefix_command_cpp =
(default) read_only = false
(default) read_only_direct = false
(default) recache = false
(default) remote_only = false
(default) remote_storage =
(default) reshare = false
(default) run_second_cpp = true
(/mnt/cache/.ccache/ccache.conf) sloppiness = pch_defines, time_macros
(default) stats = true
(default) stats_log =
(environment) temporary_dir = /tmp
(/mnt/cache/.ccache/ccache.conf) umask = 000
|
13) Soporte de enlaces de referencia (reflinks) en sistemas de archivos como XFS y BTRFS
A partir de la versión 4.0 de Ccache, se ha
incluido el soporte de enlaces de referencia (reflinks) o
también conocidos como enlaces COW (copia en escritura). Un
enlace de referencia (reflink) es una copia de un archivo similar a un
enlace duro (dos directorios apuntan a un mismo inodo), pero a
diferencia de este, hay dos entradas de inodo, y son los bloques de
datos los que se comparten. Si el archivo clonado se modifica, se
añaden más bloques de datos, pero los datos del archivo
original se mantienen siempre intactos, evitando que la caché pueda corromperse. Imprescindible la lectura de este enlace para saber las diferencias entre los diferentes tipos de enlaces disponibles en nuestro sistema.
En la caché de Ccache suele haber con bastante frecuencia
archivos duplicados, aunque el programa admite también el uso de
enlaces duros (CCACHE_HARDLINK=true), el uso de esta opción es
más segura para ahorrar espacio en el disco (aunque no se
comprima), como se puede comprobar en las estadísticas de
compresión que se muestran al final de esta sección.
Para poder hacer uso de esta opción, la caché tiene que
estar ubicada en un sistema de archivos XFS o BTRFS y, añadir lo
que está en rojo al archivo que hemos creado
anteriormente, ccache.sh:
#!/bin/sh
export CCACHE_DIR=/.ccache
export CCACHE_UMASK=000
export CCACHE_TEMPDIR=/tmp
export CCACHE_NOCPP2=true
export CCACHE_NOCOMPRESS=true
export CCACHE_FILECLONE=true |
Los enlaces de referencia no se pueden comprimir, con lo que, cuando comprobemos los datos comprimidos con el comando ccache -x, éstos aparecerán en el apartado
Incompressible data, Un ejemplo personal con la caché ubicada en una partición XFS:
[jose@localhost ~]$ ccache -x
Scanning... 100.0% [===============================================================================]
Total data: 8.6 GB (9.9 GB disk blocks)
Compressed data: 5.6 GB (29.6% of original size)
- Original data: 18.8 GB
- Compression ratio: 3.376 x (70.4% space savings)
Incompressible data: 3.1 GB |
Si tenemos pensado hacer uso de esta opción, mi
recomendación personal es que se utilice XFS como sistema de
archivos, ya que BTRFS tiende a fragmentarse mucho, con el agravante de
que, si hacemos uso del desfragmentador que posee este sistema de
archivos, los enlaces de referencia se rompen y aumenta de forma
considerable el espacio en disco ocupado por los archivos de la
caché.
14) Activar el almacenamiento en caché de hashes de archivo según el dispositivo, el inodo y las marcas de tiempo
Esta opción también ha sido incluida partir de la
versión 4.0 de Ccache y, en teoría, debería de
acelerar el uso de la caché, al reducir el tiempo empleado en hashear los
archivos de la misma, pudiendo ser reutilizado en posteriores
compilaciones. A partir de la versión 4.7 está activada
por defecto, siempre que el sistema de archivos donde está
ubicada la caché, lo permita.
Para poder hacer uso de esta opción, añadimos lo que está en rojo al archivo que hemos creado
anteriormente, ccache.sh:
#!/bin/sh
export CCACHE_DIR=/.ccache
export CCACHE_UMASK=000
export CCACHE_TEMPDIR=/tmp
export CCACHE_NOCPP2=true
export CCACHE_NOCOMPRESS=true
export CCACHE_FILECLONE=true
export CCACHE_INODECACHE=true |
15) Reducir el nivel de compresión de la caché de Ccache
Si reducimos el nivel de compresión de la caché del
programa, aumentaremos la velocidad de compresión y
descompresión sin que el tamaño de la caché
aumente demasiado. Para establecerla en -5, por ejemplo,
añadimos lo que está en rojo al archivo que hemos
creado
anteriormente, ccache.sh:
#!/bin/sh
export CCACHE_DIR=/.ccache
export CCACHE_UMASK=000
export CCACHE_TEMPDIR=/tmp
export CCACHE_NOCPP2=true
export CCACHE_NOCOMPRESS=true
export CCACHE_FILECLONE=true
export CCACHE_INODECACHE=true
export CCACHE_COMPRESSLEVEL=-5 |
Posteriormente, recomprimimos la caché existente con el siguiente comando, al nivel establecido en el archivo anterior:
[jose@localhost ~]$ ccache -X -5
Recompressing... 100.0% [==========================================================================]
Original data: 3.2 GB
Old compressed data: 1.3 GB (41.6% of original size)
- Compression ratio: 2.404 x (58.4% space savings)
New compressed data: 1.7 GB (51.6% of original size)
- Compression ratio: 1.940 x (48.4% space savings)
Size change: +318.9 MB |
Enlaces
http://ccache.dev >> La web de Ccache.
|