Linux 安装Caffe

本文按照网上教程在Ubuntu 14.04 环境下安装caffe的记录,其中安装的OpenCV 2.4.13 使用的CUDA是7.0。在这里首先将遇到的一些问题和环境不一样的地方例举如下(如果遇到其他的问题可以参考这里):

  1. 安装libboost-all-de应该改成libboost1.55-all-dev
  2. 在禁用独立显卡来安装CUDA后应该再次打开独立显卡。
  3. 安装CUDNN的指令

    1
    2
    sudo cp lib64/*  /usr/local/cuda/lib64/
    sudo cp include/cudnn.h /usr/local/cuda/include/
  4. 如下报错

    1
    2
    -- Installing Dependencies
    ./opencv_install.sh: 第 27 行: source: dependencies.sh: 文件未找到

    把安装脚本27行 dependencies.sh 改成 ./dependencies.sh

  5. 如下报错

    1
    2
    3
    4
    5
    6
    7
    CXX .build_release/src/caffe/proto/caffe.pb.cc
    In file included from .build_release/src/caffe/proto/caffe.pb.cc:5:0:
    .build_release/src/caffe/proto/caffe.pb.h:9:42: fatal error: google/protobuf/stubs/common.h: 没有那个文件或目录
    #include <google/protobuf/stubs/common.h>
    ^
    compilation terminated.
    make: *** [.build_release/src/caffe/proto/caffe.pb.o] 错误 1

    1
    2
    3
    PROTOC src/caffe/proto/caffe.proto
    make: protoc:命令未找到
    make: *** [.build_release/src/caffe/proto/caffe.pb.h] 错误 127

    安装对应的包sudo apt-get install libprotobuf-dev protobuf-c-compiler protobuf-compiler

  6. 如下报错

    1
    2
    3
    4
    5
    6
    7
    8
    CXX src/caffe/layers/recurrent_layer.cpp
    In file included from ./include/caffe/blob.hpp:8:0,
    from src/caffe/layers/recurrent_layer.cpp:4:
    ./include/caffe/common.hpp:5:27: fatal error: gflags/gflags.h: 没有那个文件或目录
    #include <gflags/gflags.h>
    ^
    compilation terminated.
    make: *** [.build_release/src/caffe/layers/recurrent_layer.o] 错误 1

    可以看出跟gflags有关,大概推测是gflags没装,于是按照教程把下面的都安装了:

    • 安装glog/gflags/lmdb
    • glog

      1
      2
      3
      4
      5
      wget https://google-glog.googlecode.com/files/glog-0.3.3.tar.gz
      tar zxvf glog-0.3.3.tar.gz
      cd glog-0.3.3
      ./configure
      make && make install
    • gflags

      1
      2
      3
      4
      5
      6
      wget https://github.com/schuhschuh/gflags/archive/master.zip
      unzip master.zip
      cd gflags-master
      mkdir build && cd build
      export CXXFLAGS="-fPIC" && cmake .. && make VERBOSE=1
      make && make install
    • lmdb

      1
      2
      3
      git clone https://gitorious.org//mdb/mdb.git
      cd mdb/libraries/liblmdb
      make && make install
  7. clone 报错

    1
    fatal: unable to access 'https://gitorious.org/mdb/mdb.git/': server certificate verification failed. CAfile: /etc/ssl/certs/ca-certificates.crt CRLfile: none

    跳过SSL验证export GIT_SSL_NO_VERIFY=1

  8. 缺乏头文件报错

    1
    2
    3
    4
    5
    src/caffe/layers/hdf5_output_layer.cpp:3:18: fatal error: hdf5.h: 没有那个文件或目录
    #include "hdf5.h"
    ^
    compilation terminated.
    make: *** [.build_release/src/caffe/layers/hdf5_output_layer.o] 错误 1
    • 首先确保安装了libhdf5-serial-dev libhdf5-dev这两个包
    • 然后

      1
      2
      3
      cd /usr/lib/x86_64-linux-gnu
      sudo ln -s libhdf5_serial.so.8.0.2 libhdf5.so
      sudo ln -s libhdf5_serial_hl.so.8.0.2 libhdf5_hl.so
    • 如果还不行就修改 MakeFile.config

      1
      2
      INCLUDE_DIRS := $(PYTHON_INCLUDE) /usr/local/include /usr/include/hdf5/serial/ and
      LIBRARY_DIRS := $(PYTHON_LIB) /usr/local/lib /usr/lib /usr/lib/x86_64-linux-gnu/hdf5/serial/
  9. 缺乏头文件报错

    1
    2
    3
    4
    5
    /include/caffe/util/db_leveldb.hpp:7:24: fatal error: leveldb/db.h: 没有那个文件或目录
    #include "leveldb/db.h"
    ^
    compilation terminated.
    make: *** [.build_release/src/caffe/util/db.o] 错误 1

    缺少了google的kv数据库:leveldb,这个在installation.md中的Optional dependencies也提到了。
    从这里下载:https://github.com/google/leveldb
    参考:https://techoverflow.net/blog/2012/12/14/compiling-installing-leveldb-on-linux/
    解压后,make
    因为没有不支持install,所以,要手工将这些include和生成的lib拷贝到需要的地方。
    cp --preserve=links out-shared/libleveldb.so* /usr/local/lib 上面只拷贝了动态库。
    `cp -r include/leveldb/ /usr/local/include/``

  10. 链接报错

    1
    2
    3
    4
    LD -o .build_release/lib/libcaffe.so.1.0.0-rc3
    /usr/bin/ld: 找不到 -lsnappy
    collect2: error: ld returned 1 exit status
    make: *** [.build_release/lib/libcaffe.so.1.0.0-rc3] 错误 1

    缺乏库 sudo apt-get install libsnappy-dev

  11. 链接报错(存在于自己编译Qt的情况需要自己指定Qt库的路径)

    1
    2
    3
    4
    CXX/LD -o .build_release/tools/upgrade_solver_proto_text.bin
    /usr/bin/ld: warning: libicui18n.so.56, needed by //home/kqf/program/Qt5.6.0/5.6/gcc_64/lib/libQt5Core.so.5, not found (try using -rpath or -rpath-link)
    /usr/bin/ld: warning: libicuuc.so.56, needed by //home/kqf/program/Qt5.6.0/5.6/gcc_64/lib/libQt5Core.so.5, not found (try using -rpath or -rpath-link)
    /usr/bin/ld: warning: libicudata.so.56, needed by //home/kqf/program/Qt5.6.0/5.6/gcc_64/lib/libQt5Core.so.5, not found (try using -rpath or -rpath-link)

    把Qt库的路径加入到链接库的搜索路径中export LD_LIBRARY_PATH=/home/kqf/program/Qt5.6.0/5.6/gcc_64/lib:$LD_LIBRARY_PATH

现将原文copy如下:

Caffe + Ubuntu 14.04 64bit + CUDA 6.5 配置说明

本步骤能实现用Intel核芯显卡来进行显示, 用NVIDIA GPU进行计算。

1. 安装开发所需的依赖包

安装开发所需要的一些基本包

1
2
sudo apt-get install build-essential  # basic requirement
sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libboost-all-dev libhdf5-serial-dev libgflags-dev libgoogle-glog-dev liblmdb-dev protobuf-compiler #required by caffe

2. 安装CUDA及驱动

2.1 准备工作

在关闭桌面管理 lightdm 的情况下安装驱动似乎可以实现Intel 核芯显卡 来显示 + NVIDIA 显卡来计算。具体步骤如下:

  1. 首先在BIOS设置里选择用Intel显卡来显示或作为主要显示设备
  2. 进入Ubuntu, 按 ctrl+alt+F1 进入tty, 登录tty后输入如下命令

    1
    sudo service lightdm stop

该命令会关闭lightdm。如果你使用 gdm或者其他的desktop manager, 请在安装NVIDIA驱动前关闭他。

2.2 下载deb包及安装CUDA

使用deb包安装CUDA及驱动能省去很多麻烦(参见CUDA Starting Guide)。下载对应于你系统的CUDA deb包, 然后用下列命令添加软件源

1
2
sudo dpkg -i cuda-repo-<distro>_<version>_<architecture>.deb
sudo apt-get update

然后用下列命令安装CUDA

1
sudo apt-get install cuda

安装完成后 reboot.

1
sudo reboot

2.3 安装cuDNN

(03-25: 今天下最新的caffe回来发现编译不过啊一直CUDNN报错浪费了我几个小时没搞定! 后来才发现caffe15小时前的更新开始使用cudnn v2, 但是官网上并没有明显提示!!! 坑爹啊!)
cuDNN能加速caffe中conv及pooling的计算。首先下载cuDNN, 然后执行下列命令解压并安装

1
2
3
4
tar -zxvf cudnn-6.5-linux-x64-v2.tgz
cd cudnn-6.5-linux-x64-v2
sudo cp lib* /usr/local/cuda/lib64/
sudo cp cudnn.h /usr/local/cuda/include/

更新软链接

1
2
3
4
cd /usr/local/cuda/lib64/
sudo rm -rf libcudnn.so libcudnn.so.6.5
sudo ln -s libcudnn.so.6.5.48 libcudnn.so.6.5
sudo ln -s libcudnn.so.6.5 libcudnn.so

2.4 设置环境变量

安装完成后需要在/etc/profile中添加环境变量, 在文件最后添加:

1
2
PATH=/usr/local/cuda/bin:$PATH
export PATH

保存后, 执行下列命令, 使环境变量立即生效

1
source /etc/profile

同时需要添加lib库路径: 在 /etc/ld.so.conf.d/加入文件 cuda.conf, 内容如下

1
/usr/local/cuda/lib64

保存后,执行下列命令使之立刻生效

1
sudo ldconfig

3. 安装CUDA SAMPLE

进入/usr/local/cuda/samples, 执行下列命令来build samples

1
sudo make all -j8

整个过程大概10分钟左右, 全部编译完成后, 进入 samples/bin/x86_64/linux/release, 运行deviceQuery

1
./deviceQuery

如果出现显卡信息, 则驱动及显卡安装成功:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
./deviceQuery Starting...

CUDA Device Query (Runtime API) version (CUDART static linking)

Detected 1 CUDA Capable device(s)

Device 0: "GeForce GTX 670"
CUDA Driver Version / Runtime Version 6.5 / 6.5
CUDA Capability Major/Minor version number: 3.0
Total amount of global memory: 4095 MBytes (4294246400 bytes)
( 7) Multiprocessors, (192) CUDA Cores/MP: 1344 CUDA Cores
GPU Clock rate: 1098 MHz (1.10 GHz)
Memory Clock rate: 3105 Mhz
Memory Bus Width: 256-bit
L2 Cache Size: 524288 bytes
Maximum Texture Dimension Size (x,y,z) 1D=(65536), 2D=(65536, 65536), 3D=(4096, 4096, 4096)
Maximum Layered 1D Texture Size, (num) layers 1D=(16384), 2048 layers
Maximum Layered 2D Texture Size, (num) layers 2D=(16384, 16384), 2048 layers
Total amount of constant memory: 65536 bytes
Total amount of shared memory per block: 49152 bytes
Total number of registers available per block: 65536
Warp size: 32
Maximum number of threads per multiprocessor: 2048
Maximum number of threads per block: 1024
Max dimension size of a thread block (x,y,z): (1024, 1024, 64)
Max dimension size of a grid size (x,y,z): (2147483647, 65535, 65535)
Maximum memory pitch: 2147483647 bytes
Texture alignment: 512 bytes
Concurrent copy and kernel execution: Yes with 1 copy engine(s)
Run time limit on kernels: Yes
Integrated GPU sharing Host Memory: No
Support host page-locked memory mapping: Yes
Alignment requirement for Surfaces: Yes
Device has ECC support: Disabled
Device supports Unified Addressing (UVA): Yes
Device PCI Bus ID / PCI location ID: 1 / 0
Compute Mode:
< Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) >

deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 6.5, CUDA Runtime Version = 6.5, NumDevs = 1, Device0 = GeForce GTX 670
Result = PASS

4. 安装Intel MKL 或Atlas

如果没有Intel MKL, 可以用下列命令安装免费的atlas

1
sudo apt-get install libatlas-base-dev

如果有mkl安装包,首先解压安装包,下面有一个install_GUI.sh文件, 执行该文件,会出现图形安装界面,根据说明一步一步执行即可。

注意: 安装完成后需要添加library路径, 创建/etc/ld.so.conf.d/intel_mkl.conf文件, 在文件中添加内容

1
2
/opt/intel/lib
/opt/intel/mkl/lib/intel64

注意把路径替换成自己的安装路径。 编辑完后执行

1
sudo ldconfig

5. 安装OpenCV (Optional, 如果运行caffe时opencv报错, 可以重新按照此步骤安装)

虽然我们已经安装了libopencv-dev, 但该库似乎会导致libtiff的相关问题, 所以我们需要从源代码build 自己的版本。这个尽量不要手动安装.

安装2.4.10 (推荐)

  1. 下载安装脚本
  2. 进入目录 Install-OpenCV/Ubuntu/2.4
  3. 执行脚本
    1
    sudo ./opencv2_4_10.sh

安装2.4.9 (deprecated)

Github上有人已经写好了完整的安装脚本, 能自动安装所有dependencies. 下载该脚本,进入Ubuntu/2.4 目录, 给所有shell脚本加上可执行权限

1
chmod +x *.sh

修改脚本opencv2_4_X.sh, 在cmake中加入参数

1
-D BUILD_TIFF=ON

然后安装(当前为2.4.9)

1
sudo ./opencv2_4_9.sh

脚本会自动安装依赖项,下载安装包,编译并安装OpenCV。整个过程大概半小时左右。

注意,安装2.4.9时中途可能会报错

1
opencv-2.4.9/modules/gpu/src/nvidia/core/NCVPixelOperations.hpp(51): error: a storage class is not allowed in an explicit specialization

解决方法在此 下载 NCVPixelOperations.hpp, 替换掉opencv2.4.9内的文件, *并注释掉opencv2_4_9.sh中下载opencv包的代码, 重新执行sudo ./opencv2_4_9.sh`.

6. 安装Caffe所需要的Python环境

6.1 安装anaconda包

在此下载最新的安装包, 用默认设置安装在用户目录下。

6.2 安装python依赖库

打开新的终端, 用which pythonwhich pip确定使用的是anaconda提供的python环境,然后进入caffe_root/python, 执行下列命令

1
for req in $(cat requirements.txt); do pip install $req; done

6.3 修正Anaconda存在的bug

加入在编译或者运行caffe时遇到这样的错误

1
/usr/lib/x86_64-linux-gnu/libx264.so.142:undefined reference to '

那么请删除掉anaconda/lib中的libm.*. 参考this issue

实际编译caffe的时候还碰到anaconda和系统的libreadline冲突的状况,需要conda remove readline (感谢@jastarex ).

6.4 添加Anaconda Library Path

这里需要注意,在运行Caffe时,可能会报一些找不到libxxx.so的错误,而用 locate libxxx.so命令发现已经安装在anaconda中,这时首先想到的是在/etc/ld.so.conf.d/ 下面将 your_anaconda_path/lib 加入 LD_LIBRARY_PATH中。 但是这样做可能导致登出后无法再进入桌面!!!原因(猜测)可能是anaconda的lib中有些内容于系统自带的lib产生冲突。

正确的做法是:为了不让系统在启动时就将anaconda/lib加入系统库目录,可以在用户自己的~/.bashrc 中添加library path, 比如我就在最后添加了两行

1
2
# add library path
export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:your_anaconda_path/lib"

开启另一个终端后即生效,并且重启后能够顺利加载lightdm, 进入桌面环境。

7. 安装MATLAB

Caffe提供了MATLAB接口, 有需要用MATLAB的同学可以额外安装MATLAB。 安装教程请自行搜索。

安装完成后添加图标

1
sudo vi /usr/share/applications/Matlab.desktop

输入以下内容

1
2
3
4
5
6
7
8
9
[Desktop Entry]
Type=Application
Name=Matlab
GenericName=Matlab R2013b
Comment=Matlab:The Language of Technical Computing
Exec=sh /usr/local/MATLAB/R2013b/bin/matlab -desktop
Icon=/usr/local/MATLAB/Matlab.png
Terminal=false
Categories=Development;Matlab;

(I use the R2013b patched package. First you should uncompress the .iso file. Then use sudo cp to copy the patch file)

8. 编译Caffe

8.1 编译主程序

终于完成了所有环境的配置,可以愉快的编译Caffe了! 进入caffe根目录, 首先复制一份Makefile.config, 然后修改里面的内容,主要需要修改的参数包括

  • CPU_ONLY 是否只使用CPU模式,没有GPU没安装CUDA的同学可以打开这个选项
  • BLAS (使用intel mkl还是atlas)
  • MATLAB_DIR 如果需要使用MATLAB wrapper的同学需要指定matlab的安装路径, 如我的路径为 /usr/local/MATLAB/R2013b (注意该目录下需要包含bin文件夹,bin文件夹里应该包含mex二进制程序)
  • DEBUG 是否使用debug模式,打开此选项则可以在eclipse或者NSight中debug程序

完成设置后, 开始编译

1
2
3
make all -j4
make test
make runtest

注意 -j4 是指使用几个线程来同时编译, 可以加快速度, j后面的数字可以根据CPU core的个数来决定, 我的CPU使4核, 所以-j4.

8.2 编译Matlab wrapper

执行如下命令

1
make matcaffe

然后就可以跑官方的matlab demo啦。

8.3 编译Python wrapper

1
make pycaffe

然后基本就全部安装完拉.

接下来大家尽情地跑demo吧~

原文copy 完毕,接下来参照这里来跑Mnist。具体过程Copy如下:

  1. 将终端定位到Caffe根目录;
  2. 下载MNIST数据库并解压缩:$ ./data/mnist/get_mnist.sh
  3. 将其转换成Lmdb数据库格式:$ ./examples/mnist/create_mnist.sh 执行完此shell脚本后,会在./examples/mnist下增加两个新目录,mnist_test_lmdb和mnist_train_lmdb

  4. train model:$ ./examples/mnist/train_lenet.sh

    1. 使用LeNet网络(《Gradient-BasedLearning Applied to Document Recognition》);
    2. 使用./examples/mnist/lenet_train_test.prototxtmodel;
    3. 使用./examples/mnist/lenet_solver.prototxtmodel;
    4. 执行train_lenet.sh脚本,会调用./build/tools目录下的caffe执行文件,此执行文件的实现是./tools目录下的caffe.cpp文件;
    5. 执行此脚本后,会生成几个文件,其中./examples/mnist/lenet_iter_10000.caffemodel则是最终训练生成的model文件;
    6. 以上默认的是在GPU模式下运行,如果想让其在CPU模式下运行,只需将lenet_solver.prototxt文件中的solver_mode字段值由原来的GPU改为CPU即可;
T B
站点访问量: / , 本页阅读量:
T B