Unify solve! for SinkhornSolver and SinkhornBarycenterSolver (#123)

zsteve · devmotion · web-flow · commit 59ff422175cc · 2021-08-31T10:56:44.000+10:00
* unify solve! for SinkhornSolver and SinkhornBarycenterSolver

* format

* reorganize and format

* removed examples/benchmark

* Update test/entropic/sinkhorn_barycenter.jl

Co-authored-by: David Widmann &lt;devmotion@users.noreply.github.com&gt;

Co-authored-by: David Widmann &lt;devmotion@users.noreply.github.com&gt;
diff --git a/src/OptimalTransport.jl b/src/OptimalTransport.jl
@@ -40,6 +40,7 @@ include("entropic/sinkhorn_epsscaling.jl")
 include("entropic/sinkhorn_unbalanced.jl")
 include("entropic/sinkhorn_barycenter.jl")
 include("entropic/sinkhorn_barycenter_gibbs.jl")
+include("entropic/sinkhorn_solve.jl")
 
 include("quadratic.jl")
 include("quadratic_newton.jl")
diff --git a/src/entropic/sinkhorn.jl b/src/entropic/sinkhorn.jl
@@ -89,123 +89,35 @@ function build_convergence_cache(
     )
 end
 
-# Sinkhorn algorithm
+# Sinkhorn algorithm steps (see solve!)
+function init_step!(solver::SinkhornSolver)
+    return A_batched_mul_B!(solver.cache.Kv, solver.cache.K, solver.cache.v)
+end
 
-function solve!(solver::SinkhornSolver)
-    # unpack solver
+function step!(solver::SinkhornSolver, iter::Int)
     μ = solver.source
     ν = solver.target
-    atol = solver.atol
-    rtol = solver.rtol
-    maxiter = solver.maxiter
-    check_convergence = solver.check_convergence
     cache = solver.cache
-    convergence_cache = solver.convergence_cache
-
-    # unpack cache
     u = cache.u
     v = cache.v
-    K = cache.K
     Kv = cache.Kv
+    K = cache.K
 
-    A_batched_mul_B!(Kv, K, v)
-
-    isconverged = false
-    to_check_step = check_convergence
-    for iter in 1:maxiter
-        # computations before the Sinkhorn iteration (e.g., absorption step)
-        prestep!(solver, iter)
-
-        # perform Sinkhorn iteration
-        u .= μ ./ Kv
-        At_batched_mul_B!(v, K, u)
-        v .= ν ./ v
-        A_batched_mul_B!(Kv, K, v)
-
-        # check source marginal
-        # always check convergence after the final iteration
-        to_check_step -= 1
-        if to_check_step == 0 || iter == maxiter
-            # reset counter
-            to_check_step = check_convergence
-
-            isconverged, abserror = OptimalTransport.check_convergence(
-                μ, u, Kv, convergence_cache, atol, rtol
-            )
-            @debug string(solver.alg) *
-                   " (" *
-                   string(iter) *
-                   "/" *
-                   string(maxiter) *
-                   ": absolute error of source marginal = " *
-                   string(maximum(abserror))
-
-            if isconverged
-                @debug "$(solver.alg) ($iter/$maxiter): converged"
-                break
-            end
-        end
-    end
-
-    if !isconverged
-        @warn "$(solver.alg) ($maxiter/$maxiter): not converged"
-    end
-
-    return nothing
-end
-
-# for single inputs
-function check_convergence(
-    μ::AbstractVector,
-    u::AbstractVector,
-    Kv::AbstractVector,
-    cache::SinkhornConvergenceCache,
-    atol::Real,
-    rtol::Real,
-)
-    # unpack
-    tmp = cache.tmp
-    norm_μ = cache.norm_source
-
-    # do not overwrite `Kv` but reuse it for computing `u` if not converged
-    tmp .= u .* Kv
-    norm_uKv = sum(abs, tmp)
-    tmp .= abs.(μ .- tmp)
-    norm_diff = sum(tmp)
-
-    isconverged = norm_diff < max(atol, rtol * max(norm_μ, norm_uKv))
-
-    return isconverged, norm_diff
+    u .= μ ./ Kv
+    At_batched_mul_B!(v, K, u)
+    v .= ν ./ v
+    return A_batched_mul_B!(Kv, K, v)
 end
 
-# for batches
-function check_convergence(
-    μ::AbstractVecOrMat,
-    u::AbstractMatrix,
-    Kv::AbstractMatrix,
-    cache::SinkhornBatchConvergenceCache,
-    atol::Real,
-    rtol::Real,
-)
-    # unpack
-    tmp = cache.tmp
-    tmp2 = cache.tmp2
-    norm_μ = cache.norm_source
-    norm_uKv = cache.norm_uKv
-    norm_diff = cache.norm_diff
-    isconverged = cache.isconverged
-
-    # do not overwrite `Kv` but reuse it for computing `u` if not converged
-    tmp .= u .* Kv
-    tmp2 .= abs.(tmp)
-    sum!(norm_uKv, tmp2)
-    tmp .= abs.(μ .- tmp)
-    sum!(norm_diff, tmp)
-
-    # check stopping criterion
-    @. isconverged = norm_diff < max(atol, rtol * max(norm_μ, norm_uKv))
-
-    return all(isconverged), norm_diff
+function check_convergence(solver::SinkhornSolver)
+    return OptimalTransport.check_convergence(
+        solver.source,
+        solver.cache.u,
+        solver.cache.Kv,
+        solver.convergence_cache,
+        solver.atol,
+        solver.rtol,
+    )
 end
 
 # API
diff --git a/src/entropic/sinkhorn_barycenter.jl b/src/entropic/sinkhorn_barycenter.jl
@@ -48,69 +48,6 @@ function build_solver(
     return solver
 end
 
-function solve!(solver::SinkhornBarycenterSolver)
-    # unpack solver 
-    μ = solver.source
-    w = solver.w
-    atol = solver.atol
-    rtol = solver.rtol
-
-    maxiter = solver.maxiter
-    check_convergence = solver.check_convergence
-    cache = solver.cache
-    convergence_cache = solver.convergence_cache
-
-    # unpack cache
-    u = cache.u
-    v = cache.v
-    K = cache.K
-    Kv = cache.Kv
-    a = cache.a
-
-    isconverged = false
-    to_check_step = check_convergence
-    A_batched_mul_B!(Kv, K, v)
-    for iter in 1:maxiter
-        # prestep if needed (not used for SinkhornBarycenterSolver{SinkhornGibbs})
-        prestep!(solver, iter)
-
-        # Sinkhorn iteration
-        a .= prod(Kv' .^ w; dims=1)'  # TODO: optimise 
-        u .= a ./ Kv
-        At_batched_mul_B!(v, K, u)
-        v .= μ ./ v
-        A_batched_mul_B!(Kv, K, v)
-
-        # decrement check marginal step
-        to_check_step -= 1
-        # check convergence
-        if to_check_step == 0 || iter == maxiter
-            # reset counter
-            to_check_step = check_convergence
-
-            isconverged, abserror = OptimalTransport.check_convergence(
-                a, u, Kv, convergence_cache, atol, rtol
-            )
-            @debug string(solver.alg) *
-                   " (" *
-                   string(iter) *
-                   "/" *
-                   string(maxiter) *
-                   ": absolute error of source marginal = " *
-                   string(maximum(abserror))
-
-            if isconverged
-                @debug "$(solver.alg) ($iter/$maxiter): converged"
-                break
-            end
-        end
-    end
-    if !isconverged
-        @warn "$(solver.alg) ($maxiter/$maxiter): not converged"
-    end
-    return nothing
-end
-
 """
     sinkhorn_barycenter(μ, C, ε, w, alg = SinkhornGibbs(); kwargs...)
 
diff --git a/src/entropic/sinkhorn_barycenter_gibbs.jl b/src/entropic/sinkhorn_barycenter_gibbs.jl
@@ -30,8 +30,41 @@ function build_cache(
     return SinkhornBarycenterGibbsCache(u, v, K, Kv, a)
 end
 
+# Sinkhorn algorithm steps (see solve!)
 prestep!(::SinkhornBarycenterSolver{SinkhornGibbs}, ::Int) = nothing
 
+function init_step!(solver::SinkhornBarycenterSolver{SinkhornGibbs})
+    return A_batched_mul_B!(solver.cache.Kv, solver.cache.K, solver.cache.v)
+end
+
+function step!(solver::SinkhornBarycenterSolver{SinkhornGibbs}, iter::Int)
+    μ = solver.source
+    w = solver.w
+    cache = solver.cache
+    u = cache.u
+    v = cache.v
+    Kv = cache.Kv
+    K = cache.K
+    a = cache.a
+
+    a .= prod(Kv' .^ w; dims=1)'  # TODO: optimise 
+    u .= a ./ Kv
+    At_batched_mul_B!(v, K, u)
+    v .= μ ./ v
+    return A_batched_mul_B!(Kv, K, v)
+end
+
+function check_convergence(solver::SinkhornBarycenterSolver{SinkhornGibbs})
+    return OptimalTransport.check_convergence(
+        solver.cache.a,
+        solver.cache.u,
+        solver.cache.Kv,
+        solver.convergence_cache,
+        solver.atol,
+        solver.rtol,
+    )
+end
+
 function solution(solver::SinkhornBarycenterSolver{SinkhornGibbs})
     cache = solver.cache
     return cache.u[:, 1] .* cache.Kv[:, 1]
diff --git a/src/entropic/sinkhorn_gibbs.jl b/src/entropic/sinkhorn_gibbs.jl
@@ -81,6 +81,7 @@ function sinkhorn(
         kwargs...,
     )
 end
+
 function sinkhorn2(
     μ,
     ν,
diff --git a/src/entropic/sinkhorn_solve.jl b/src/entropic/sinkhorn_solve.jl
@@ -0,0 +1,105 @@
+# Convergence checks 
+#
+# for single inputs
+function check_convergence(
+    μ::AbstractVector,
+    u::AbstractVector,
+    Kv::AbstractVector,
+    cache::SinkhornConvergenceCache,
+    atol::Real,
+    rtol::Real,
+)
+    # unpack
+    tmp = cache.tmp
+    norm_μ = cache.norm_source
+
+    # do not overwrite `Kv` but reuse it for computing `u` if not converged
+    tmp .= u .* Kv
+    norm_uKv = sum(abs, tmp)
+    tmp .= abs.(μ .- tmp)
+    norm_diff = sum(tmp)
+
+    isconverged = norm_diff < max(atol, rtol * max(norm_μ, norm_uKv))
+
+    return isconverged, norm_diff
+end
+
+# for batches
+function check_convergence(
+    μ::AbstractVecOrMat,
+    u::AbstractMatrix,
+    Kv::AbstractMatrix,
+    cache::SinkhornBatchConvergenceCache,
+    atol::Real,
+    rtol::Real,
+)
+    # unpack
+    tmp = cache.tmp
+    tmp2 = cache.tmp2
+    norm_μ = cache.norm_source
+    norm_uKv = cache.norm_uKv
+    norm_diff = cache.norm_diff
+    isconverged = cache.isconverged
+
+    # do not overwrite `Kv` but reuse it for computing `u` if not converged
+    tmp .= u .* Kv
+    tmp2 .= abs.(tmp)
+    sum!(norm_uKv, tmp2)
+    tmp .= abs.(μ .- tmp)
+    sum!(norm_diff, tmp)
+
+    # check stopping criterion
+    @. isconverged = norm_diff < max(atol, rtol * max(norm_μ, norm_uKv))
+
+    return all(isconverged), norm_diff
+end
+
+# Common solve! operation 
+function solve!(solver::Union{SinkhornSolver,SinkhornBarycenterSolver})
+    # unpack solver
+    atol = solver.atol
+    rtol = solver.rtol
+    maxiter = solver.maxiter
+    check_convergence = solver.check_convergence
+    cache = solver.cache
+    convergence_cache = solver.convergence_cache
+
+    isconverged = false
+    to_check_step = check_convergence
+    # initial step if needed 
+    init_step!(solver)
+    for iter in 1:maxiter
+        # computations before the Sinkhorn iteration (e.g., absorption step)
+        prestep!(solver, iter)
+        # perform Sinkhorn iteration
+        step!(solver, iter)
+
+        # check source marginal
+        # always check convergence after the final iteration
+        to_check_step -= 1
+        if to_check_step == 0 || iter == maxiter
+            # reset counter
+            to_check_step = check_convergence
+
+            isconverged, abserror = OptimalTransport.check_convergence(solver)
+            @debug string(solver.alg) *
+                   " (" *
+                   string(iter) *
+                   "/" *
+                   string(maxiter) *
+                   ": absolute error of source marginal = " *
+                   string(maximum(abserror))
+
+            if isconverged
+                @debug "$(solver.alg) ($iter/$maxiter): converged"
+                break
+            end
+        end
+    end
+
+    if !isconverged
+        @warn "$(solver.alg) ($maxiter/$maxiter): not converged"
+    end
+
+    return nothing
+end

Original file line number	Diff line number	Diff line change
`@@ -81,6 +81,7 @@ function sinkhorn(`
`81`	`81`	`kwargs...,`
`82`	`82`	`)`
`83`	`83`	`end`
	`84`	`+`
`84`	`85`	`function sinkhorn2(`
`85`	`86`	`μ,`
`86`	`87`	`ν,`