Flux.train failing with CUDA GPU

bjenkinsgit · March 18, 2019, 4:40pm

I’m testing some julia Deep Learning code and at the point of invoking Flux.train, I get the following:

ReadOnlyMemoryError()

specifically, I’m invoking the train function call like so:

@time for i in 1:100
Flux.train!(loss, params, data, opt)
end

and I get the following stack trace:

Stacktrace:
[1] gemv!(::Char, ::Float32, ::CuArray{Float32,2}, ::Array{Float32,1}, ::Float32, ::Array{Float32,1}) at /buildworker/worker/package_linux64/build/usr/share/julia/stdlib/v1.1/LinearAlgebra/src/blas.jl:577
[2] gemv!(::Array{Float32,1}, ::Char, ::CuArray{Float32,2}, ::Array{Float32,1}) at /buildworker/worker/package_linux64/build/usr/share/julia/stdlib/v1.1/LinearAlgebra/src/matmul.jl:360
[3] * at /buildworker/worker/package_linux64/build/usr/share/julia/stdlib/v1.1/LinearAlgebra/src/matmul.jl:64 [inlined]
[4] _forward at /home/bwj/.julia/packages/Flux/8XpDt/src/tracker/lib/array.jl:361 [inlined]
[5] #track#1 at /home/bwj/.julia/packages/Flux/8XpDt/src/tracker/Tracker.jl:51 [inlined]
[6] track at /home/bwj/.julia/packages/Flux/8XpDt/src/tracker/Tracker.jl:51 [inlined]
[7] * at /home/bwj/.julia/packages/Flux/8XpDt/src/tracker/lib/array.jl:353 [inlined]
[8] Dense at /home/bwj/.julia/packages/Flux/8XpDt/src/layers/basic.jl:82 [inlined]
[9] Dense at /home/bwj/.julia/packages/Flux/8XpDt/src/layers/basic.jl:122 [inlined]
[10] (::Dense{typeof(σ),TrackedArray{…,CuArray{Float32,2}},TrackedArray{…,CuArray{Float32,1}}})(::Array{Float64,1}) at /home/bwj/.julia/packages/Flux/8XpDt/src/layers/basic.jl:125
[11] applychain(::Tuple{Dense{typeof(σ),TrackedArray{…,CuArray{Float32,2}},TrackedArray{…,CuArray{Float32,1}}},Dense{typeof(σ),TrackedArray{…,CuArray{Float32,2}},TrackedArray{…,CuArray{Float32,1}}}}, ::Array{Float64,1}) at /home/bwj/.julia/packages/Flux/8XpDt/src/layers/basic.jl:31
[12] Chain at /home/bwj/.julia/packages/Flux/8XpDt/src/layers/basic.jl:33 [inlined]
[13] loss(::Array{Float64,1}, ::Flux.OneHotVector) at ./In[13]:1
[14] macro expansion at /home/bwj/.julia/packages/Flux/8XpDt/src/optimise/train.jl:74 [inlined]
[15] macro expansion at /home/bwj/.julia/packages/Juno/B1s6e/src/progress.jl:133 [inlined]
[16] #train!#12(::getfield(Flux.Optimise, Symbol(“##14#18”)), ::Function, ::Function, ::Function, ::Base.Iterators.Zip{Tuple{Array{Array{Float64,1},1},Array{Flux.OneHotVector,1}}}, ::Function) at /home/bwj/.julia/packages/Flux/8XpDt/src/optimise/train.jl:72
[17] train!(::Function, ::Function, ::Base.Iterators.Zip{Tuple{Array{Array{Float64,1},1},Array{Flux.OneHotVector,1}}}, ::Function) at /home/bwj/.julia/packages/Flux/8XpDt/src/optimise/train.jl:70
[18] macro expansion at ./In[17]:2 [inlined]
[19] macro expansion at ./util.jl:156 [inlined]
[20] top-level scope at ./In[17]:1 [inlined]
[21] top-level scope at ./none:0

I am running on Ubuntu 18.04 LTS
nvidia-settings reports NVIDIA Driver version: 418.43
running the MNIST cuDNN outputs:

cudnnGetVersion() : 7500 , CUDNN_VERSION from cudnn.h : 7500 (7.5.0)
Host compiler version : GCC 7.3.0

When I run Pkg.test(“Flux”) I get the following:

jling · March 26, 2019, 5:37pm

does this report any error?

(v1.1) pkg> build

bjenkinsgit · March 26, 2019, 7:41pm

I assume you mean: Pkg.build(“Flux”) ?

bjenkinsgit · March 26, 2019, 7:52pm

output from issuing the command Pkg.build(“Flux”)

julia> Pkg.build(“Flux”)
Building SpecialFunctions → ~/.julia/packages/SpecialFunctions/fvheQ/deps/build.log
Building ZipFile ─────────→ ~/.julia/packages/ZipFile/p60bh/deps/build.log
Building CodecZlib ───────→ ~/.julia/packages/CodecZlib/9jDi1/deps/build.log

I get 0 errors. Re-running Pkg.test(“Flux”) gives me errors starting with GPU tests…

jling · March 27, 2019, 12:07am

actually I meant build as that would build everything because I ran into issues with arpack doesn’t build but only affects GPU Flux.

bjenkinsgit · March 27, 2019, 1:57pm

[SOLVED] Ok. The key step was to go into (what I can only assume is called) “command mode” by hitting the ‘]’ key (which gave me that “(v1.1) pkg” prompt and then typing “update”. This then updated my CUDA related packages and then built them for 1.1.0. Then, running “test Flux” gave me a clean and error free set of test results. Yay!

Topic		Replies	Views
Simple Flux NN + GPU error New to Julia question	2	2208	March 21, 2019
ReadOnlyMemoryError General Usage	14	6442	March 9, 2021
Flux: ERROR: OutOfMemoryError() New to Julia flux	1	416	October 4, 2019
Crashes and high utilization while training with Flux with GPU GPU cudanative , cuda , flux , machine-learning	2	1314	May 17, 2020
`CUDA error: out of memory` with Flux Machine Learning flux	4	1643	August 24, 2020

Flux.train failing with CUDA GPU

Related topics