CliMA · odunbar · Nov 22, 2024 · Nov 22, 2024 · Nov 26, 2024 · Nov 26, 2024
diff --git a/examples/catke-ces/Project.toml b/examples/catke-ces/Project.toml
@@ -0,0 +1,10 @@
+[deps]
+CalibrateEmulateSample = "95e48a1f-0bec-4818-9538-3db4340308e3"
+Distributions = "31c24e10-a181-5473-b8eb-7969acd0382f"
+EnsembleKalmanProcesses = "aa8a2aa5-91d8-4396-bcef-d4f2ec43552d"
+JLD2 = "033835bb-8acc-5ee8-8aae-3f567f8a3819"
+LinearAlgebra = "37e2e46d-f89d-539d-b4ee-838fcccc9c8e"
+Plots = "91a5bcdd-55d7-5caf-9e0b-520d859cae80"
+Random = "9a3f8284-a2c9-5f02-9a11-845980a1fd5c"
+Statistics = "10745b16-79ce-11e8-11f9-7d13ad32a3b2"
+StatsBase = "2913bbd2-ae8a-5f71-8c99-4fb6c76f3a91"
diff --git a/examples/catke-ces/emulate_sample.jl b/examples/catke-ces/emulate_sample.jl
@@ -0,0 +1,268 @@
+using JLD2
+using Distributions  # probability distributions and associated functions
+using LinearAlgebra
+using Random
+using JLD2
+using StatsBase
+using Plots
+
+# CES 
+using CalibrateEmulateSample.Emulators
+using CalibrateEmulateSample.MarkovChainMonteCarlo
+using CalibrateEmulateSample.ParameterDistributions
+using CalibrateEmulateSample.DataContainers
+using CalibrateEmulateSample.EnsembleKalmanProcesses
+using CalibrateEmulateSample.EnsembleKalmanProcesses.Localizers
+using CalibrateEmulateSample.Utilities
+
+
+data_file = joinpath(@__DIR__, "catke_parameters.jld2")
+
+    # contains:
+    loaded_data = load(data_file)
+    objectives = loaded_data["objectives"]
+    @info "objectives size $(size(objectives))"
+    phys_parameters = loaded_data["parameters"]
+    @info "parameters size $(size(phys_parameters))"
+    #observations = loaded_data["observations"]
+    #@info "observations size $size(observations)"
+    # noise_covariance = loaded_data["noise_covariance"]
+    # observations = loaded_data["observations"]
+    n_iter, n_ens, n_param = size(phys_parameters)
+
+    # (use priors to transform parameters into computational space)
+    # get from initial ensemble
+    #prior_mean = mean(parameters[1,:,:], dims=1)
+    #prior_cov = cov(parameters[1,:,:], dims=1)
+    #@info "det prior cov: $(det(prior_cov))"
+    #@info "pos def prior cov?: $(isposdef(prior_cov))"
+    prior_vec = [
+        constrained_gaussian("CᵂwΔ", 4.0, 2.0, 0.0, 8.0),
+        constrained_gaussian("Cᵂu★", 4.0, 2.0, 0.0, 8.0),
+        constrained_gaussian("Cʰⁱc", 1.0, 0.5, 0.0, 2.0),
+        constrained_gaussian("Cʰⁱu", 1.0, 0.5, 0.0, 2.0),
+        constrained_gaussian("Cʰⁱe", 5.0, 2.5, 0.0, 10.0),
+        constrained_gaussian("CʰⁱD", 5.0, 2.5, 0.0, 10.0),
+        constrained_gaussian("Cˢ", 1.0, 0.5, 0.0, 2.0),
+        constrained_gaussian("Cˡᵒc", 1.0, 0.5, 0.0, 2.0),
+        constrained_gaussian("Cˡᵒu", 1.0, 0.5, 0.0, 2.0),
+        constrained_gaussian("Cˡᵒe", 5.0, 2.5, 0.0, 10.0),
+        constrained_gaussian("CˡᵒD", 5.0, 2.5, 0.0, 10.0),
+        constrained_gaussian("CRi⁰", 1.0, 0.5, 0.0, 2.0),
+        constrained_gaussian("CRiᵟ", 1.0, 0.5, 0.0, 2.0),
+        constrained_gaussian("Cᵘⁿc", 1.0, 0.5, 0.0, 2.0),
+        constrained_gaussian("Cᵘⁿu", 1.0, 0.5, 0.0, 2.0),
+        constrained_gaussian("Cᵘⁿe", 5.0, 2.5, 0.0, 10.0),
+        constrained_gaussian("CᵘⁿD", 5.0, 2.5, 0.0, 10.0),
+        constrained_gaussian("Cᶜc", 4.0, 2.0, 0.0, 8.0),
+        constrained_gaussian("Cᶜu", 4.0, 2.0, 0.0, 8.0),
+        constrained_gaussian("Cᶜe", 4.0, 2.0, 0.0, 8.0),
+        constrained_gaussian("CᶜD", 4.0, 2.0, 0.0, 8.0),
+        constrained_gaussian("Cᵉc", 0.5, 0.25, 0.0, 1.0),
+        constrained_gaussian("Cˢᵖ", 0.5, 0.25, 0.0, 1.0),
+    ]
+    prior = combine_distributions(prior_vec)
+
+    # we map in the computational space
+    parameters = zeros(size(phys_parameters))
+    for i =1:size(phys_parameters,1)
+        parameters[i,:,:] = transform_constrained_to_unconstrained(prior, phys_parameters[i,:,:]')'
+    end
+
+
+    ## CES on compressed data
+
+    io_pair_iter = 20
+    n_samples = 10
+    burnin = 50
+    iter_train = burnin+1:io_pair_iter:burnin+1+io_pair_iter*n_samples
+    @info "train on iterations: $(iter_train)"
+    inputs = reduce(vcat, [parameters[i,:,:] for i in iter_train])
+    outputs = reduce(vcat, objectives[iter_train,:])[:,:] 
+    @info "training data input: $(size(inputs)) output: $(size(outputs))"
+    input_output_pairs = PairedDataContainer(inputs, outputs, data_are_columns=false)
+    @info size(get_inputs(input_output_pairs))
+   # estimate the noise in the objective using trailing samples
+    estimation_iter = 50
+    Γ = zeros(1,1)
+    Γ[1,1] = var(reduce(vcat, objectives[end - estimation_iter:end,:]))
+    @info "estimated_noise: $Γ"
+
+    truth = [minimum(objectives);]
+    @info "data: $(truth)"
+
+    @info "Finished inverse problem and data wrangling stage"
+    #try GP JL
+    gppackage = Emulators.GPJL()
+    pred_type = Emulators.YType()
+
+    mlt_methods = ["GP", "Scalar-RF"]
+
+    mlt_method = mlt_methods[2]
+
+    if mlt_method == "GP"
+        mlt = GaussianProcess(
+            gppackage;
+            kernel = nothing, # use default squared exponential kernel
+            prediction_type = pred_type,
+            noise_learn = false,
+        )
+        mlt_untuned = ScalarRandomFeatureInterface(
+            1000,
+            n_param,
+            kernel_structure = SeparableKernel(LowRankFactor(), OneDimFactor()),
+            optimizer_options = Dict( "n_features_opt" => 100, "n_iteration" => 0, "n_cross_val_sets" => 1, "cov_sample_multiplier" => 0.01), 
+        )
+
+    elseif mlt_method == "Scalar-RF"
+        overrides = Dict(
+            "verbose" => true,
+            "n_features_opt" => 200,
+            "train_fraction" => 0.9,
+            "n_iteration" => 10,
+            "cov_sample_multiplier" => 0.4,
+            "n_ensemble" => 50, #40*n_dimensions,
+            "n_cross_val_sets" => 3,
+        )
+
+        rank = 7
+        nugget=1e-4
+        kernel_structure = SeparableKernel(LowRankFactor(rank, nugget), OneDimFactor())
+
+        n_features = 1000
+
+        mlt = ScalarRandomFeatureInterface(
+            n_features,
+            n_param,
+            kernel_structure = kernel_structure,
+            optimizer_options = deepcopy(overrides),
+        )
+
+        mlt_untuned = ScalarRandomFeatureInterface(
+            n_features,
+            n_param,
+            kernel_structure = kernel_structure,
+            optimizer_options = Dict( "n_features_opt" => 100,  "n_iteration" => 0, "n_cross_val_sets" => 1, "cov_sample_multiplier" => 0.01), #this is too hacky 
+        )
+
+    end
+
+
+    # Fit an emulator to the data
+    emulator = Emulator(
+        mlt,
+        input_output_pairs;
+        obs_noise_cov = Γ
+    )
+    # Optimize the GP hyperparameters for better fit
+    optimize_hyperparameters!(emulator)
+
+    # For comparison, an untuned emulator
+emulator_untuned = Emulator(
+    mlt_untuned,
+    input_output_pairs;
+    obs_noise_cov = Γ
+)
+
+
+    @info "Finished Emulation stage"
+
+
+    # test the emulator against some other trajectory data
+    pred_mean_train = zeros(1,size(get_inputs(input_output_pairs),2))    
+    pred_mean_train_untuned = copy(pred_mean_train)
+    for i in 1:size(get_inputs(input_output_pairs),2)
+        pred_mean_train[:,i] = Emulators.predict(emulator, get_inputs(input_output_pairs)[:,i:i], transform_to_real = true)[1]
+        pred_mean_train_untuned[:,i] = Emulators.predict(emulator_untuned, get_inputs(input_output_pairs)[:,i:i], transform_to_real = true)[1]
+    end
+    train_error = norm(pred_mean_train - get_outputs(input_output_pairs))/size(get_inputs(input_output_pairs),2)
+    train_error_untuned = norm(pred_mean_train_untuned - get_outputs(input_output_pairs))/size(get_inputs(input_output_pairs),2)
+    @info "average L^2 train_error untuned: $(train_error_untuned) and tuned: $(train_error)"
+
+
+    min_iter_test = maximum(iter_train) + 1
+    iter_test = min_iter_test:min_iter_test + 20
+
+    @info "test on iterations: $(iter_test)"
+    test_inputs = reduce(vcat, [parameters[i,:,:] for i in iter_test])
+    test_outputs = reduce(vcat, objectives[iter_test,:])[:,:] 
+    @info "testing data input: $(size(test_inputs)) output: $(size(test_outputs))"
+    pred_mean_test = zeros(length(iter_test)*n_ens,1)    
+    pred_mean_test_untuned = copy(pred_mean_test)
+    for i in 1:size(test_inputs,1)
+        pred_mean_test[i,:] = Emulators.predict(emulator, test_inputs[i:i,:]', transform_to_real = true)[1]
+        pred_mean_test_untuned[i,:] = Emulators.predict(emulator_untuned, test_inputs[i:i,:]', transform_to_real = true)[1]
+    end
+    test_error = norm(pred_mean_test - test_outputs)/size(test_inputs,1)
+    test_error_untuned = norm(pred_mean_test_untuned - test_outputs)/size(test_inputs,1)
+    @info "average L^2 test_error untuned: $(test_error_untuned) and tuned: $(test_error)"
+
+
+    # determine a good step size
+    u0 = vec(mean(parameters[end,:,:], dims = 1))
+    @info "initial parameters: $(u0)"
+    yt_sample = truth
+    mcmc = MCMCWrapper(pCNMHSampling(), yt_sample, prior, emulator, init_params=u0)
+
+    new_step = optimize_stepsize(mcmc; init_stepsize = 1e-3, N = 5000, discard_initial = 0)
+    chain = MarkovChainMonteCarlo.sample(mcmc, 300_000; stepsize = new_step, discard_initial = 2_000)
+    posterior = MarkovChainMonteCarlo.get_posterior(mcmc, chain)
+
+    @info "Finished Sampling stage: tuned"
+    # extract some statistics
+    post_mean = mean(posterior)
+    post_cov = cov(posterior)
+    println("mean in of posterior samples (taken in comp space)")
+    println(post_mean)
+    println("covariance of posterior samples (taken in comp space)")
+    println(post_cov)
+    println("transformed posterior mean from comp to phys space")
+    println(transform_unconstrained_to_constrained(posterior, post_mean))
+
+    # map to physical space
+    posterior_samples = vcat([get_distribution(posterior)[name] for name in get_name(posterior)]...) #samples are columns
+    transformed_posterior_samples =
+        mapslices(x -> transform_unconstrained_to_constrained(posterior, x), posterior_samples, dims = 1)
+    println("mean of posterior samples (taken in phys space)")
+    println(mean(transformed_posterior_samples, dims = 2))
+    println("cov of posterior samples (taken in phys space)")
+    println(cov(transformed_posterior_samples, dims = 2))
+
+
+# plot some useful marginals
+p = plot(posterior)
+vline!(p, mean(phys_parameters[end,:,:],dims=1), linewidth=5, color=:red)
+# vline!(p, mean(phys_parameters[end,:,:],dims=1)) # where training data ended up.
+
+savefig(p, joinpath(@__DIR__, "catke_posterior.png"))
+savefig(p, joinpath(@__DIR__, "catke_posterior.pdf"))
+
+plot!(p, prior, color=:grey)
+minval=minimum(minimum(phys_parameters[iter_train,:,:],dims=1),dims=2)[:]
+maxval=maximum(maximum(phys_parameters[iter_train,:,:],dims=1),dims=2)[:]
+vline!(p, reshape(minval,1,:), linewidth=5, color=:grey)
+vline!(p, reshape(maxval,1,:), linewidth=5, color=:grey)
+
+savefig(p, joinpath(@__DIR__, "catke_prior_posterior.png"))
+savefig(p, joinpath(@__DIR__, "catke_prior_posterior.pdf"))
+
+
+
+## Untuned:
+
+
+mcmc_untuned = MCMCWrapper(pCNMHSampling(), yt_sample, prior, emulator, init_params=u0)
+
+new_step_untuned = optimize_stepsize(mcmc_untuned; init_stepsize = 1e-3, N = 5000, discard_initial = 0)
+chain_untuned = MarkovChainMonteCarlo.sample(mcmc_untuned, 300_000; stepsize = new_step_untuned, discard_initial = 2_000)
+posterior_untuned = MarkovChainMonteCarlo.get_posterior(mcmc_untuned, chain_untuned)
+
+@info "Finished Sampling stage: untuned"
+
+p2 = plot(posterior)
+plot!(p2, posterior_untuned, color=:grey, alpha=0.3)
+vline!(p2, mean(phys_parameters[end,:,:],dims=1), linewidth=5, color=:red)
+
+
+savefig(p2, joinpath(@__DIR__, "catke_tuned-untuned_posterior.png"))
+savefig(p2, joinpath(@__DIR__, "catke_tuned-untuned_posterior.pdf"))