本文按照网上教程在Ubuntu 14.04 环境下安装caffe的记录,其中安装的OpenCV 2.4.13 使用的CUDA是7.0。在这里首先将遇到的一些问题和环境不一样的地方例举如下(如果遇到其他的问题可以参考这里):
- 安装
libboost-all-de
应该改成libboost1.55-all-dev
- 在禁用独立显卡来安装CUDA后应该再次打开独立显卡。
- 安装CUDNN的指令
1
2sudo cp lib64/* /usr/local/cuda/lib64/
sudo cp include/cudnn.h /usr/local/cuda/include/ - 如下报错 把安装脚本27行
1
2-- Installing Dependencies
./opencv_install.sh: 第 27 行: source: dependencies.sh: 文件未找到dependencies.sh
改成./dependencies.sh
- 如下报错 或
1
2
3
4
5
6
7CXX .build_release/src/caffe/proto/caffe.pb.cc
In file included from .build_release/src/caffe/proto/caffe.pb.cc:5:0:
.build_release/src/caffe/proto/caffe.pb.h:9:42: fatal error: google/protobuf/stubs/common.h: 没有那个文件或目录
#include <google/protobuf/stubs/common.h>
^
compilation terminated.
make: *** [.build_release/src/caffe/proto/caffe.pb.o] 错误 1安装对应的包1
2
3PROTOC src/caffe/proto/caffe.proto
make: protoc:命令未找到
make: *** [.build_release/src/caffe/proto/caffe.pb.h] 错误 127sudo apt-get install libprotobuf-dev protobuf-c-compiler protobuf-compiler
- 如下报错 可以看出跟gflags有关,大概推测是gflags没装,于是按照教程把下面的都安装了:
1
2
3
4
5
6
7
8CXX src/caffe/layers/recurrent_layer.cpp
In file included from ./include/caffe/blob.hpp:8:0,
from src/caffe/layers/recurrent_layer.cpp:4:
./include/caffe/common.hpp:5:27: fatal error: gflags/gflags.h: 没有那个文件或目录
#include <gflags/gflags.h>
^
compilation terminated.
make: *** [.build_release/src/caffe/layers/recurrent_layer.o] 错误 1
- 安装glog/gflags/lmdb
- glog
1
2
3
4
5wget https://google-glog.googlecode.com/files/glog-0.3.3.tar.gz
tar zxvf glog-0.3.3.tar.gz
cd glog-0.3.3
./configure
make && make install - gflags
1
2
3
4
5
6wget https://github.com/schuhschuh/gflags/archive/master.zip
unzip master.zip
cd gflags-master
mkdir build && cd build
export CXXFLAGS="-fPIC" && cmake .. && make VERBOSE=1
make && make install - lmdb
1
2
3git clone https://gitorious.org//mdb/mdb.git
cd mdb/libraries/liblmdb
make && make install
- clone 报错 跳过SSL验证
1
fatal: unable to access 'https://gitorious.org/mdb/mdb.git/': server certificate verification failed. CAfile: /etc/ssl/certs/ca-certificates.crt CRLfile: none
export GIT_SSL_NO_VERIFY=1
- 缺乏头文件报错
1
2
3
4
5src/caffe/layers/hdf5_output_layer.cpp:3:18: fatal error: hdf5.h: 没有那个文件或目录
#include "hdf5.h"
^
compilation terminated.
make: *** [.build_release/src/caffe/layers/hdf5_output_layer.o] 错误 1
- 首先确保安装了
libhdf5-serial-dev libhdf5-dev
这两个包 - 然后
1
2
3cd /usr/lib/x86_64-linux-gnu
sudo ln -s libhdf5_serial.so.8.0.2 libhdf5.so
sudo ln -s libhdf5_serial_hl.so.8.0.2 libhdf5_hl.so - 如果还不行就修改
MakeFile.config
1
2INCLUDE_DIRS := $(PYTHON_INCLUDE) /usr/local/include /usr/include/hdf5/serial/ and
LIBRARY_DIRS := $(PYTHON_LIB) /usr/local/lib /usr/lib /usr/lib/x86_64-linux-gnu/hdf5/serial/
缺乏头文件报错
1
2
3
4
5/include/caffe/util/db_leveldb.hpp:7:24: fatal error: leveldb/db.h: 没有那个文件或目录
#include "leveldb/db.h"
^
compilation terminated.
make: *** [.build_release/src/caffe/util/db.o] 错误 1缺少了google的kv数据库:leveldb,这个在installation.md中的Optional dependencies也提到了。
从这里下载:https://github.com/google/leveldb
参考:https://techoverflow.net/blog/2012/12/14/compiling-installing-leveldb-on-linux/
解压后,make
因为没有不支持install,所以,要手工将这些include和生成的lib拷贝到需要的地方。
cp --preserve=links out-shared/libleveldb.so* /usr/local/lib
上面只拷贝了动态库。
`cp -r include/leveldb/ /usr/local/include/``链接报错
1
2
3
4LD -o .build_release/lib/libcaffe.so.1.0.0-rc3
/usr/bin/ld: 找不到 -lsnappy
collect2: error: ld returned 1 exit status
make: *** [.build_release/lib/libcaffe.so.1.0.0-rc3] 错误 1缺乏库
sudo apt-get install libsnappy-dev
链接报错(存在于自己编译Qt的情况需要自己指定Qt库的路径)
1
2
3
4CXX/LD -o .build_release/tools/upgrade_solver_proto_text.bin
/usr/bin/ld: warning: libicui18n.so.56, needed by //home/kqf/program/Qt5.6.0/5.6/gcc_64/lib/libQt5Core.so.5, not found (try using -rpath or -rpath-link)
/usr/bin/ld: warning: libicuuc.so.56, needed by //home/kqf/program/Qt5.6.0/5.6/gcc_64/lib/libQt5Core.so.5, not found (try using -rpath or -rpath-link)
/usr/bin/ld: warning: libicudata.so.56, needed by //home/kqf/program/Qt5.6.0/5.6/gcc_64/lib/libQt5Core.so.5, not found (try using -rpath or -rpath-link)把Qt库的路径加入到链接库的搜索路径中
export LD_LIBRARY_PATH=/home/kqf/program/Qt5.6.0/5.6/gcc_64/lib:$LD_LIBRARY_PATH
。
现将原文copy如下:
Caffe + Ubuntu 14.04 64bit + CUDA 6.5 配置说明
本步骤能实现用Intel核芯显卡来进行显示, 用NVIDIA GPU进行计算。
1. 安装开发所需的依赖包
安装开发所需要的一些基本包
1 | sudo apt-get install build-essential # basic requirement |
2. 安装CUDA及驱动
2.1 准备工作
在关闭桌面管理 lightdm 的情况下安装驱动似乎可以实现Intel 核芯显卡 来显示 + NVIDIA 显卡来计算。具体步骤如下:
首先在BIOS设置里选择用Intel显卡来显示或作为主要显示设备
进入Ubuntu, 按 ctrl+alt+F1 进入tty, 登录tty后输入如下命令
1
sudo service lightdm stop
该命令会关闭lightdm。如果你使用 gdm或者其他的desktop manager, 请在安装NVIDIA驱动前关闭他。
2.2 下载deb包及安装CUDA
使用deb包安装CUDA及驱动能省去很多麻烦(参见CUDA Starting Guide)。下载对应于你系统的CUDA deb包, 然后用下列命令添加软件源
1 | sudo dpkg -i cuda-repo-<distro>_<version>_<architecture>.deb |
然后用下列命令安装CUDA
1 | sudo apt-get install cuda |
安装完成后 reboot.
1 | sudo reboot |
2.3 安装cuDNN
(03-25: 今天下最新的caffe回来发现编译不过啊一直CUDNN报错浪费了我几个小时没搞定! 后来才发现caffe15小时前的更新开始使用cudnn v2, 但是官网上并没有明显提示!!! 坑爹啊!)
cuDNN能加速caffe中conv及pooling的计算。首先下载cuDNN, 然后执行下列命令解压并安装
1 | tar -zxvf cudnn-6.5-linux-x64-v2.tgz |
更新软链接
1 | cd /usr/local/cuda/lib64/ |
2.4 设置环境变量
安装完成后需要在/etc/profile
中添加环境变量, 在文件最后添加:
1 | PATH=/usr/local/cuda/bin:$PATH |
保存后, 执行下列命令, 使环境变量立即生效
1 | source /etc/profile |
同时需要添加lib库路径: 在 /etc/ld.so.conf.d/
加入文件 cuda.conf
, 内容如下
1 | /usr/local/cuda/lib64 |
保存后,执行下列命令使之立刻生效
1 | sudo ldconfig |
3. 安装CUDA SAMPLE
进入/usr/local/cuda/samples
, 执行下列命令来build samples
1 | sudo make all -j8 |
整个过程大概10分钟左右, 全部编译完成后, 进入 samples/bin/x86_64/linux/release
, 运行deviceQuery
1 | ./deviceQuery |
如果出现显卡信息, 则驱动及显卡安装成功:
1 | ./deviceQuery Starting... |
4. 安装Intel MKL 或Atlas
如果没有Intel MKL, 可以用下列命令安装免费的atlas
1 | sudo apt-get install libatlas-base-dev |
如果有mkl安装包,首先解压安装包,下面有一个install_GUI.sh文件, 执行该文件,会出现图形安装界面,根据说明一步一步执行即可。
注意: 安装完成后需要添加library路径, 创建/etc/ld.so.conf.d/intel_mkl.conf
文件, 在文件中添加内容
1 | /opt/intel/lib |
注意把路径替换成自己的安装路径。 编辑完后执行
1 | sudo ldconfig |
5. 安装OpenCV (Optional, 如果运行caffe时opencv报错, 可以重新按照此步骤安装)
虽然我们已经安装了libopencv-dev
, 但该库似乎会导致libtiff的相关问题, 所以我们需要从源代码build 自己的版本。这个尽量不要手动安装.
安装2.4.10 (推荐)
- 下载安装脚本
- 进入目录
Install-OpenCV/Ubuntu/2.4
- 执行脚本
1
sudo ./opencv2_4_10.sh
安装2.4.9 (deprecated)
Github上有人已经写好了完整的安装脚本, 能自动安装所有dependencies. 下载该脚本,进入Ubuntu/2.4
目录, 给所有shell脚本加上可执行权限
1 | chmod +x *.sh |
修改脚本opencv2_4_X.sh
, 在cmake中加入参数
1 | -D BUILD_TIFF=ON |
然后安装(当前为2.4.9)
1 | sudo ./opencv2_4_9.sh |
脚本会自动安装依赖项,下载安装包,编译并安装OpenCV。整个过程大概半小时左右。
注意,安装2.4.9
时中途可能会报错
1 | opencv-2.4.9/modules/gpu/src/nvidia/core/NCVPixelOperations.hpp(51): error: a storage class is not allowed in an explicit specialization |
解决方法在此 下载 NCVPixelOperations.hpp, 替换掉opencv2.4.9内的文件, *并注释掉opencv2_4_9.sh
中下载opencv包的代码, 重新执行
sudo ./opencv2_4_9.sh`.
6. 安装Caffe所需要的Python环境
6.1 安装anaconda包
在此下载最新的安装包, 用默认设置安装在用户目录下。
6.2 安装python依赖库
打开新的终端, 用which python
和which pip
确定使用的是anaconda提供的python环境,然后进入caffe_root/python
, 执行下列命令
1 | for req in $(cat requirements.txt); do pip install $req; done |
6.3 修正Anaconda存在的bug
加入在编译或者运行caffe时遇到这样的错误
1 | /usr/lib/x86_64-linux-gnu/libx264.so.142:undefined reference to ' |
那么请删除掉anaconda/lib
中的libm.*
. 参考this issue
实际编译caffe的时候还碰到anaconda和系统的libreadline冲突的状况,需要conda remove readline (感谢@jastarex ).
6.4 添加Anaconda Library Path
这里需要注意,在运行Caffe时,可能会报一些找不到libxxx.so
的错误,而用 locate libxxx.so
命令发现已经安装在anaconda中,这时首先想到的是在/etc/ld.so.conf.d/
下面将 your_anaconda_path/lib
加入 LD_LIBRARY_PATH
中。 但是这样做可能导致登出后无法再进入桌面!!!原因(猜测)可能是anaconda的lib中有些内容于系统自带的lib产生冲突。
正确的做法是:为了不让系统在启动时就将anaconda/lib加入系统库目录,可以在用户自己的~/.bashrc
中添加library path, 比如我就在最后添加了两行
1 | # add library path |
开启另一个终端后即生效,并且重启后能够顺利加载lightdm, 进入桌面环境。
7. 安装MATLAB
Caffe提供了MATLAB接口, 有需要用MATLAB的同学可以额外安装MATLAB。 安装教程请自行搜索。
安装完成后添加图标
1 | sudo vi /usr/share/applications/Matlab.desktop |
输入以下内容
1 | [Desktop Entry] |
(I use the R2013b patched package. First you should uncompress the .iso file. Then use sudo cp to copy the patch file)
8. 编译Caffe
8.1 编译主程序
终于完成了所有环境的配置,可以愉快的编译Caffe了! 进入caffe根目录, 首先复制一份Makefile.config
, 然后修改里面的内容,主要需要修改的参数包括
- CPU_ONLY 是否只使用CPU模式,没有GPU没安装CUDA的同学可以打开这个选项
- BLAS (使用intel mkl还是atlas)
- MATLAB_DIR 如果需要使用MATLAB wrapper的同学需要指定matlab的安装路径, 如我的路径为
/usr/local/MATLAB/R2013b
(注意该目录下需要包含bin文件夹,bin文件夹里应该包含mex二进制程序) - DEBUG 是否使用debug模式,打开此选项则可以在eclipse或者NSight中debug程序
完成设置后, 开始编译
1 | make all -j4 |
注意 -j4
是指使用几个线程来同时编译, 可以加快速度, j后面的数字可以根据CPU core的个数来决定, 我的CPU使4核, 所以-j4.
8.2 编译Matlab wrapper
执行如下命令
1 | make matcaffe |
然后就可以跑官方的matlab demo啦。
8.3 编译Python wrapper
1 | make pycaffe |
然后基本就全部安装完拉.
接下来大家尽情地跑demo吧~
原文copy 完毕,接下来参照这里来跑Mnist。具体过程Copy如下:
将终端定位到Caffe根目录;
下载MNIST数据库并解压缩:$ ./data/mnist/get_mnist.sh
将其转换成Lmdb数据库格式:$ ./examples/mnist/create_mnist.sh 执行完此shell脚本后,会在./examples/mnist下增加两个新目录,mnist_test_lmdb和mnist_train_lmdb
train model:$ ./examples/mnist/train_lenet.sh
使用LeNet网络(《Gradient-BasedLearning Applied to Document Recognition》);
使用./examples/mnist/lenet_train_test.prototxtmodel;
使用./examples/mnist/lenet_solver.prototxtmodel;
执行train_lenet.sh脚本,会调用./build/tools目录下的caffe执行文件,此执行文件的实现是./tools目录下的caffe.cpp文件;
执行此脚本后,会生成几个文件,其中./examples/mnist/lenet_iter_10000.caffemodel则是最终训练生成的model文件;
以上默认的是在GPU模式下运行,如果想让其在CPU模式下运行,只需将lenet_solver.prototxt文件中的solver_mode字段值由原来的GPU改为CPU即可;